logo Insalogo Insa

Logiciels et Méthodes d'exploration Statistique des Données

Objectifs

A la fin de ce module, l'étudiant devra avoir compris et pourra expliquer (principaux concepts) :
- Organisation et préparation des données avec SAS, R et Python. Syntaxe des principales procédures SAS et des langages R et Python. Macro commandes et fonctions.
- Exploration statistique de données multidimensionnelles, réduction de dimension et classification automatique avec SAS, R, Pyhton.
- Interprétation statistique des différents types de représentations graphiques en analyse factorielle et classification.

L'étudiant devra être capable de :
- Gérer des grandes masses de données avec SAS, R et Python.
- Conduire l'analyse exploratoire de données massives : méthodes uni, bi et multivariées (ACP, AFCM, AFD, CAH, kmeans, modèles de mélange, DBSCAN) adaptées à la structure des données.
- Détecter des structures particulières dans des jeux de données complexes et en faire l'interprétation.

Evaluation

L'évaluation des acquis d'apprentissage est réalisée en continu tout le long du semestre. En fonction des enseignements, elle peut prendre différentes formes : examen écrit, oral, compte-rendu, rapport écrit, évaluation par les pairs...