Data analysis
Description
Objectifs
At the end of this module, the student will have understood and be able to explain (main concepts):
- Data base organisation of R and Python data frames. Syntaxes R and Python languages. R and Python functions design, program and test.
- Statistical analyses of multidimensional data: dimension reduction and clustering with R and Python.
- Statistical interpretation of various graphical displays including the different kinds of factor analyses and clustering.
The student will be able to:
- Manage big data sets with R and Python.
- Lead exploratory data analyses of real big data. It includes univariate, bivariate and multivariate data analyses featuring PCA, MCA, FDA, NMF kmeans, mixture models, DBSCAN¿ depending on data structures and analysis purposes;
- Detect relevant structures within complex data sets and compile insightful interpretations.
Pré-requis
Évaluation
L’évaluation des acquis d’apprentissage est réalisée en continu tout le long du semestre. En fonction des enseignements, elle peut prendre différentes formes : examen écrit, oral, compte-rendu, rapport écrit, évaluation par les pairs…
En bref
Crédits ECTS : 4.0
Nombre d’heures : 58.0

INSA Toulouse
135 avenue de Rangueil
31077 Toulouse cedex 4
Tél : 05 61 55 95 13
Fax : 05 61 55 95 00

Dans un souci d'alléger le texte et sans aucune discrimination de genre, l'emploi du genre masculin est utilisé à titre épicène.