logo Insalogo Insa

La recherche en Science des Données massives

Analyste, ça fait trop Wall Street ; statisticien, ça agace les économistes ; chercheur scientifique, ça fait trop académique. Pourquoi pas « data scientist » ?

Dans un entretien publié dans l’Obs[1], D. Patil (LinkedIn) explique comment il a « inventé » la Science des Données en 2008 avec J. Hammerbacher (Directeur du département Data chez Facebook).

 

Le battage médiatique autour des « big data » est une conséquence directe de l’expansion de la vente en ligne, de celle des réseaux sociaux, en résumé, du développement d’internet. Mais l’avalanche de données ne concerne pas que le tertiaire. Depuis quelques années, c’est tout le secteur industriel, notamment toulousain, qui est impacté avec la généralisation des capteurs connectés sur les chaînes de production, les ouvrages de génie civil, les appareils en exploitation...

 

Ainsi, lors des essais en vol d’un A350, 650 000 paramètres sont mesurés en permanence.

 

Dans ce nouveau paysage, les enseignants / chercheurs du département de mathématiques de l’INSA, tous membres de l’Institut de Mathématiques de Toulouse (UMR CNRS 5219), reçoivent de nombreuses sollicitations : demande de stages, projets de recherches, thèses CIFRE.

 

Les plus concernés par la « science des données » sont également membres de l’équipe projet AOC (apprentissage, optimisation, complexité) du Labex CIMI (centre international de mathématiques et d’informatique).

 

Les projets de thèses achevées et en cours concernent l’analyse de trajectoires GPS, la détection d’anomalies lors des tests réalisés sur les satellites avant lancement, la détection de défaillances sur une chaîne de fabrication, l’analyse de données volumineuses dans le domaine des transports… à brève échéance des problèmes de maintenance préventive.

 

Cette pression amont de la recherche  impacte évidemment l’enseignement. La spécialité de l’INSA devenue « Mathématiques Appliquées » formait déjà aux algorithmes d’apprentissage machine. Ce contenu est renforcé dans la nouvelle maquette avec un accès aux dernières technologies : Hadoop, Spark, cloud computing… afin de préparer au mieux les étudiants aux défis de la science des données massives.

 

 

Contacts : philippe.besse @ insa-toulouse.fr, beatrice.laurent @ insa-toulouse.fr

 

[1] http://tempsreel.nouvelobs.com/tech/20170411.OBS7885/dj-patil-ex-sorcier-des-chiffres-d-obama-j-ai-invente-le-concept-de-data-scientist.html