logo Insalogo Insa

Apprentissage statistique

Objectifs

A la fin de ce module, l'étudiant devra avoir compris et pourra expliquer (principaux concepts) :
- Principe de la vraisemblance pénalisée pour effectuer un compromis entre le biais et la variance d'un modèle
- Sélection de variable optimale et/ou régularisation
- Sélection et validation de modèles statistique
- Estimation sans biais de l'erreur de prédiction
L'étudiant devra être capable de :
- Analyser des jeux de données de très grande dimension, issus de divers domaines (biologie, médecine, assurance, marketing, finance...) avec les logiciels statistiques classiques (SAS, R).
- Ajuster des modèles statistiques en régression et en classification à l'aide de diverses approches
- (modèle linéaire généralisé, PLS, k plus proches voisins, arbres binaires, SVM, bagging, boosting...)
- Estimer divers types d'erreurs de prédiction
- Optimiser la sélection de modèle afin de construire et de valider le meilleur modèle prédictif
- Appliquer ces méthodes sur des jeux de données réelles.

Pré-requis

Eléments de modélisation statistique.
Exploration et logiciels statistiques.

Evaluation

L'évaluation des acquis d'apprentissage est réalisée en continue tout le long du semestre. En fonction des enseignements, elle peut prendre différentes formes : examen écrit, oral, compte-rendu, rapport écrit, évaluation par les pairs...