Analyser les Big Data avec Microsoft R (M20773)

Analyser les Big Data avec Microsoft R (M20773)2018-04-10T10:19:52+01:00

Analyser les Big Data avec Microsoft R

Résumé

En proposant aux entreprises une plateforme d’analyse prédictive évolutive dans le Cloud, Microsoft entend démocratiser l’apprentissage automatique (Machine Learning). Parce qu’il intègre les différentes solutions d’analyse prédictive du marché (Hadoop, Spark,…), R Server permet d’une part aux entreprises de bénéficier d’une robuste plateforme d’analyse capable de s’adapter aux volumes croissants de données à traiter et d’ absorber des pics d’activités en maitrisant les coûts, et d’autre part d’héberger tous les développement liés aux différents projets Big Data. Les participants à cette formation de 3 jours acquerront les compétences et connaissances nécessaires à la création et à la mise en oeuvre d’analyses Big Data sur un environnement Hadoop, Spark ou encore SQL Server.
  • Pouvoir expliquer comment Microsoft R Server et Microsoft R Client fonctionnent
  • Apprendre à utiliser R Client avec R Server pour explorer des données contenues dans différents magasins de données
  • Être capable de visualiser les données en utilisant des graphiques
  • Comprendre comment transformer et nettoyer des ensembles de données
  • Savoir mettre en oeuvre des options pour diviser les travaux d’analyse en tâches parallèles
  • Pouvoir construire et évaluer les modèles de régression générés à partir des données
  • Être en mesure de créer, marquer et déployer des modèles de partition générés à partir de données
  • Apprendre à utiliser R dans les environnements SQL Server et Hadoop
  • Toute personne qui souhaite analyser de grands ensembles de données dans un environnement Big Data
  • Développeur qui doit intégrer les analyses R dans ses solutions
  • Avoir suivi la formation « Les fondamentaux de l’analyse statistique avec R » (BI103) ou disposer des connaissances équivalentes
  • Connaissance des méthodes statistiques et des meilleures pratiques d’analyse de données
  • Connaissances de Windows et de ses fonctionnalités principales
  • Connaissance pratique des bases de données relationnelles

MICROSOFT R SERVER ET R CLIENT

  • Qu’est-ce qu’un serveur Microsoft R
  • Utilisation du client Microsoft R
  • Les fonctions ScaleR

EXPLORER DE GRANDES DONNÉES

  • Comprendre les sources de données ScaleR
  • Lecture de données dans un objet XDF
  • Résumer des données dans un objet XDF

VISUALISATION D’UN GRAND NOMBRE DE DONNÉES

  • Visualisation des données en mémoire
  • Visualisation d’un grand nombre de données

TRAITEMENT D’UN GRAND NOMBRE DE DONNÉES

  • Transformer un grand nombre de données
  • Gestion d’un ensemble de données

OPÉRATIONS D’ANALYSE EN PARALLÈLE

  • Utilisation du contexte de calcul RxLocalParallel avec rxExec
  • Utilisation du package revoPemaR

CRÉATION ET ÉVALUATION DE MODÈLES DE RÉGRESSION

  • Clustering Big Data
  • Générer des modèles de régression et faire des prédictions

CRÉATION ET ÉVALUATION DE MODÈLES DE PARTITIONNEMENT

  • Création de modèles de partitionnement basés sur des arbres de décision
  • Tester les modèles de partitionnement en effectuant et en comparant des prédictions

TRAITEMENT D’UN GRAND NOMBRE DE DONNÉES DANS SQL SERVER ET HADOOP

  • Utilisation de R dans SQL Server
  • Utilisation de Hadoop Map / Reduce
  • Utilisation de Hadoop Spark