Data analysis

Description

Program (detailed contents):

— Introduction to exploratory data analysis
– Programing in R and write a Rmarkdown report
– Factor methods:  Reminder on principal component analysis (PCA). Variants of PCA for qualitative data (correspondence analysis), classification (linear discriminant analysis), distance-based data (multidimensional scaling)
– Clustering: K-means and its variants, hierarchical clustering, mixture models and EM algorithm. 

Objectifs

At the end of this module, the student will have understood and be able to explain (main concepts):

- Statistical analyses of multidimensional data: dimension reduction and clustering with R 
- Statistical interpretation of various graphical displays including the different kinds of factor analyses and clustering.


At the end of this module, the student should be able to:

- Manage an exploratory analysis on a dataset using R software and write a report using Rmarkdown 
- Explain and apply PCA, MCA, MFA, MDS, LDA 
- Explain and apply clustering methods: Kmeans and its variants, hierarchical clustering, DBSCAN and mixture models

Pré-requis

Statistics: descriptive statistics
Probability: random vectors, probability distribution, Bayes law, multivariate normal distribution.
Algebra: vector spaces, Euclidean spaces, matrix calculus, eigenvalue decomposition.
Geometry / mecanics: barycenter, inertia, Huygens formula.

Évaluation

L’évaluation des acquis d’apprentissage est réalisée en continu tout le long du semestre. En fonction des enseignements, elle peut prendre différentes formes : examen écrit, oral, compte-rendu, rapport écrit, évaluation par les pairs…

En bref

Crédits ECTS : 3.0

Nombre d’heures : 62.0

EN 1 Clic

Annuaire

ENT

Rejoindre
les équipes

Marchés publics

Soutenir l'excellence

Fondation
INSA
Taxe
apprentissage

INSA Toulouse
135 avenue de Rangueil
31077 Toulouse cedex 4
Tél : 05 61 55 95 13
Fax : 05 61 55 95 00

Logo Communauté d'universités et établissements de Toulouse
Logo Bienvenue En France

Dans un souci d'alléger le texte et sans aucune discrimination de genre, l'emploi du genre masculin est utilisé à titre épicène.

INSA Toulouse
Résumé de la politique de confidentialité

Ce site utilise des cookies afin que nous puissions vous fournir la meilleure expérience utilisateur possible. Les informations sur les cookies sont stockées dans votre navigateur et remplissent des fonctions telles que vous reconnaître lorsque vous revenez sur notre site Web et aider notre équipe à comprendre les sections du site que vous trouvez les plus intéressantes et utiles.
En cliquant sur "Accepter", vous acceptez l'utilisation de cookies en provenance de ce site ainsi que notre politique de protection des données personnelles.