Description
Ce stage vous donnera l'opportunité de saisir les défis et les contributions du Big Data, ainsi que les technologies nécessaires à son application. Vous serez formé à l'intégration de grandes quantités de données structurées et non structurées par le biais d'un ETL, puis à leur analyse en utilisant des modèles statistiques et des tableaux de bord dynamiques.
À qui s'adresse cette formation ?
Pour qui ?
Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.
Prérequis
Compréhension fondamentale des modèles relationnels, de la statistique et des langages de programmation.
Compréhension fondamentale des principes de la Business Intelligence.
Les objectifs de la formation
Programme de la formation
- Comprendre les concepts et les enjeux du Big Data
- Origines et définition du Big Data : la BI face à la croissance et à la diversité des données.
- Les chiffres clés du marché dans le monde et en France.
- Les enjeux du Big Data : ROI, organisation, confidentialité des données.
- Un exemple d'architecture Big Data.
- Les technologies du Big Data
- Description de l'architecture et des composants de la plateforme Hadoop.
- Les modes de stockage (NoSQL, HDFS).
- Principes de fonctionnement de MapReduce.
- Présentation des distributions principales du marché et des outils complémentaires (Hortonworks, Cloudera, MapR, Aster).
- Installer une plateforme Hadoop.
- Présentation des technologies spécifiques pour le Big Data (Talend, Tableau, Qlikview).
- Exercice: Installation d'une plateforme Big Data complète via Cloudera et ses composants.
- Gérer les données structurées et non structurées
- Principes de fonctionnement de Hadoop Distributed File System (HDFS).
- Importer des données externes vers HDFS.
- Réaliser des requêtes SQL avec HIVE.
- Utiliser PIG pour traiter la donnée.
- Utiliser un ETL pour industrialiser la création de flux de données massives.
- Présentation de Talend For Big Data.
- Exercice: Implémentation de flux de données massives.
- Les méthodes d'analyse des données pour le Big Data
- Les méthodes d'exploration.
- Segmentation et classification.
- Estimation et prédiction.
- L'implémentation des modèles.
- Exercice: Mise en place d'analyses avec le logiciel R.
- Data visualisation et cas d'usage concrets
- Les outils de restitution du marché.
- Méthodologie de mise en forme des rapports.
- Apport du Big Data pour le "Social Business".
- Mesurer l'e-réputation et la notoriété d'une marque.
- Mesurer l'expérience et la satisfaction clients, optimiser le parcours client.
- Exercice: Installation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques, récupération de données issues de réseaux sociaux et création d'analyse d'e-réputation.
- Conclusion
- Ce qu'il faut retenir.
- Synthèse des bonnes pratiques.
- Bibliographie.