Apprentissage Machine
Objectifs
A la fin de ce module, l'étudiant devra avoir compris et pourra expliquer (principaux concepts) :
- Les propriétés des principales méthodes d¿apprentissage et leurs limites.
- Le principe du compromis biais-variance, de la sélection de modèles
- Les algorithmes et les méthodes d¿estimation d¿un risque (bootstrap, validation croisée)
- L'optimisation et l¿implémentation des principales méthodes en R et Python (Scikit-learn).
- Les principes éthiques et juridiques de l¿Intelligence Artificielle.
L'étudiant devra être capable de :
- Analyser des jeux de données massives issus de divers domaines (assurance, marketing, industrie...) avec les librairies de R et Python.
- Mettre en œuvre les principales méthodes et exécuter les algorithmes d¿apprentissage suivants : analyse discriminante, k plus proches voisins, algorithmes d¿apprentissage supervisé basés sur les méthodes à noyaux, arbres de classification et de régression, forêts aléatoires, réseaux de neurones.
- Optimiser les valeurs des hyper-paramètres, automatiser la chaîne des traitements.
- Optimiser la gestion des données manquantes.
- Détecter les failles légales ou éthiques (biais, discrimination, opacité) des algorithmes d'apprentissage automatique.
Pré-requis
Éléments de Modélisation statistique
Introduction aux langages R et Python
Évaluation
L’évaluation des acquis d’apprentissage est réalisée en continu tout le long du semestre. En fonction des enseignements, elle peut prendre différentes formes : examen écrit, oral, compte-rendu, rapport écrit, évaluation par les pairs…
En bref
Crédits ECTS : 4.0
Nombre d’heures : 52.0

INSA Toulouse
135 avenue de Rangueil
31077 Toulouse cedex 4
Tél : 05 61 55 95 13
Fax : 05 61 55 95 00

Dans un souci d'alléger le texte et sans aucune discrimination de genre, l'emploi du genre masculin est utilisé à titre épicène.