Description
Le datamining repose sur la maîtrise des techniques d'exploration de données fondamentales : statistiques descriptives, prédictives ou exploratoires. Ce stage pratique vous présentera des méthodes telles que les régressions et les ACP et vous apprendra à les mettre en oeuvre avec le logiciel R.
À qui s'adresse cette formation ?
Pour qui ?Responsables Infocentre / Datamining / Marketing / Qualité, utilisateurs et gestionnaires métiers de bases de données.
Prérequis
Les objectifs de la formation
Programme de la formation
- Introduction à la modélisation
- Modélisation : la régression.
- Modélisation statistique : rappels des tests statistiques.
- Analyse de données.
- Introduction au logiciel R.
- Travaux pratiques Présentation de plusieurs exemples de modélisation.
- Installation de R et des packages à manipuler.
- Applications sur R des tests et interprétations sur exemples.
- Analyse de régression linéaire
- Principe de régression linéaire.
- Régression simple, lorsque le modèle comporte un seul paramètre pour des données continues.
- Régression multiple, lorsqu'il y a plus d'un paramètre.
- Autres types de modèles pour données continues.
- Travaux pratiques Application pratique sur R.
- Cas de régression simple et de régression multiple.
- Analyse de régression logistique
- Présentation des différents types de régression logistique.
- Régression logistique Binaire.
- Régression logistique Ordinale.
- Régression logistique Multinomiale.
- Travaux pratiques Application sur R avec des cas pratiques pour des cas de données non continues.
- Traitements sur des données à deux modalités, puis avec des modalités ordinales, puis des modalités nominales.
- Analyse en composantes
- Présentation des différents types d'analyses et sélection.
- Analyse en Composantes Principales (ACP).
- Analyse des Correspondances Multiples (ACM).
- Classification Hiérarchique sur Composantes Principales (CHCP).
- Travaux pratiques Les composantes principales permettent de comprendre la structure de covariance des variables initiales et/ou à créer un plus petit nombre de variables à l'aide de cette structure.
- Applications sur R.
- Analyse factorielle des données
- Comprendre le principe de l'analyse factorielle : résumer la structure des données en un nombre inférieur de dimensions.
- Analyse Factorielle des Correspondances (AFC).
- Analyse Factorielle Multiple (AFM).
- Analyse Factorielle pour Données Mixtes (AFDM).
- Travaux pratiques Exercices d'analyse factorielle sur R.
- Identification des "facteurs" sous-jacents des dimensions associées à une variabilité importante.