logo Insalogo Insa

Technologie pour l'Analyse de Données Massives

Objectifs

- Les principes de passage aux échelles : volume, variété, vélocité
- Les propriétés des principaux environnements (Pyhton, Spark) de travail spécifiques aux données massives. Map Reduce.
- Leur mise en œuvre dans différents environnements matériels.


L'étudiant devra être capable de :
- Préparer, transformer des données massives dans des environnements Python et Spark.
- Identifier les méthodes adaptées à ces données massives sur les cas d'usage les plus classiques (images, système de recommandation, fouille de texte¿)
- Déployer, optimiser, ces méthodes et algorithmes dans l¿environnement le plus adapté et en valider les performances.
- Auto-apprendre le déploiement et l'utilisation sur un cas d'usage d'une technologie récente de son choix.

Pré-requis

Exploration Statistique des données
Apprentissage Machine
Langages R, Python

Evaluation

L'évaluation des acquis d'apprentissage est réalisée en continu tout le long du semestre. En fonction des enseignements, elle peut prendre différentes formes : examen écrit, oral, compte-rendu, rapport écrit, évaluation par les pairs...

Bourse

http://wikistat.fr
Pentreath N. « Machine Learning with Spark », Packt Publishing, 2015.