Formation - Big Data, méthodes et solutions pratiques pour l'analyse des données
Skills Campus
Tranning & certification centerDescription
Ce stage vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en oeuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.
À qui s'adresse cette formation ?
Pour qui ?Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.
PrérequisLes objectifs de la formation
Programme de la formation
- Comprendre les concepts et les enjeux du Big Data
- Origines et définition du Big Data : la BI face à la croissance et à la diversité des données.
- Les chiffres clés du marché dans le monde et en France.
- Les enjeux du Big Data : ROI, organisation, confidentialité des données.
- Un exemple d'architecture Big Data.
- Les technologies du Big Data
- Description de l'architecture et des composants de la plateforme Hadoop.
- Les modes de stockage (NoSQL, HDFS).
- Principes de fonctionnement de MapReduce.
- Présentation des distributions principales du marché et des outils complémentaires (Hortonworks, Cloudera, MapR, Aster).
- Installer une plateforme Hadoop.
- Présentation des technologies spécifiques pour le Big Data (Talend, Tableau, Qlikview .
- ).
- Exercice: Installation d'une plateforme Big Data complète via Cloudera et ses composants.
- Gérer les données structurées et non structurées
- Principes de fonctionnement de Hadoop Distributed File System (HDFS).
- Importer des données externes vers HDFS.
- Réaliser des requêtes SQL avec HIVE.
- Utiliser PIG pour traiter la donnée.
- Utiliser un ETL pour industrialiser la création de flux de données massives.
- Présentation de Talend For Big Data.
- Exercice: Implémentation de flux de données massives.
- Les méthodes d'analyse des données pour le Big Data
- Les méthodes d'exploration.
- Segmentation et classification.
- Estimation et prédiction.
- L'implémentation des modèles.
- Exercice: Mise en place d'analyses avec le logiciel R.
- Data visualisation et cas d'usage concrets
- Les outils de restitution du marché.
- Méthodologie de mise en forme des rapports.
- Apport du Big Data pour le "Social Business".
- Mesurer l'e-réputation et la notoriété d'une marque.
- Mesurer l'expérience et la satisfaction clients, optimiser le parcours client.
- Exercice: Installation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques, récupération de données issues de réseaux sociaux et création d'analyse d'e-réputation.
- Conclusion
- Ce qu'il faut retenir.
- Synthèse des bonnes pratiques.
- Bibliographie.