Programme (contenu détaillé) :
– Introduction à l’exploration de données.
– Syntaxe et objets de R et Python, écriture de fonctions, programmation objet et fonctionnelle (Python).
– Méthodes factorielles : rappel de l’analyse en composantes principales (ACP). Variantes de l’ACP pour les données qualitatives (analyse des correspondances), la classification supervisée (analyse linéaire discriminante), les données définies par des distances (positionnement multidimensionnel), le passage au non-linéaire (ACP à noyau).
– Méthodes de clustering : rappel des méthodes de base (k-means, classification hiérarchique). Modèles de mélange et algorithme EM. Découpe en communauté ou clustering de graphes.
– Factorisation non négative de matrices et introduction aux méthodes de recommandation












