Data analysis
Description
Objectifs
At the end of this module, the student will have understood and be able to explain (main concepts):
-The main steps of a data science analysis: preparation, visualization & exploration, prediction, interpretation.
-The main methods in data exploration.
-The main concepts / dangers of statistical learning.
-The main methods of statistical learning on vector data, requiring little expert knowledge / tuning.
-The functioning of R and Python software for data science.
At the end of this module, the student should be able to:
-Solve simple exercises about the underlying mathematical theory.
-Put in action the data science methodology on case studies with R and Python.
-Criticize the assumptions and results, summarize the main conclusions.
Pré-requis
Statistics: descriptive statistics
Probability: random vectors, probability distribution, Bayes law, multivariate normal distribution.
Algebra: vector spaces, Euclidean spaces, matrix calculus, eigenvalue decomposition.
Geometry / mecanics: barycenter, inertia, Huygens formula.
Évaluation
L’évaluation des acquis d’apprentissage est réalisée en continu tout le long du semestre. En fonction des enseignements, elle peut prendre différentes formes : examen écrit, oral, compte-rendu, rapport écrit, évaluation par les pairs…
En bref
Crédits ECTS : 3.0
Nombre d’heures : 62.0

INSA Toulouse
135 avenue de Rangueil
31077 Toulouse cedex 4
Tél : 05 61 55 95 13
Fax : 05 61 55 95 00

Dans un souci d'alléger le texte et sans aucune discrimination de genre, l'emploi du genre masculin est utilisé à titre épicène.