Mastère spécialisé
Valorisation des données massives
Ce mastère spécialisé conjoint est co-accrédité par l’INP-ENSEEIHT et l’INSA Toulouse. Il est centré sur le traitement et la valorisation de données massives, privilégiant une déclinaison pluridisciplinaire en informatique et sciences des données et conjuguant les apprentissages scientifiques et opérationnels via un apprentissage par projet et une implication forte d’entreprises partenaires.
Formation
Il s’agit de former des professionnels ayant à la fois des compétences pointues en informatique, en optimisation et en science des données pour la valorisation des gisements de données.
La formation abordera les aspects techniques et légaux répondant ainsi aux attentes des métiers suivants : data scientist, data engineer, data manager, data analyst, chef de projet, ingénieur en informatique décisionnelle, responsable de contrôle qualité. L’originalité de la formation est d’adresser un spectre large de compétences en informatique, en science des données et en optimisation.
Programme
Unité d’Enseignement (UE) | Volume | ECTS | Lieu (dispensé) |
Conférences | 20h | 3 | ENSEEIHT et INSA Toulouse |
Infrastructures système et réseau, virtualisées pour le big data | 48h | 4 | INSA Toulouse |
Plateformes Middleware pour le big data | 48h | 4 | ENSEEIHT |
Calcul haute performance et applications | 48h | 4 | ENSEEIHT |
Algorithmes d’optimisation numérique pour l’apprentissage | 48h | 4 | ENSEEIHT |
Optimisation combinatoire et apprentissage | 48h | 4 | INSA Toulouse |
Apprentissage machine | 48h | 4 | INSA Toulouse |
Technologies pour l’Intelligence Artificielle | 48h | 4 | INSA Toulouse |
Learning par étude de cas | 48h | 6 | ENSEEIHT |
Projet transverse | 68h | 8 | ENSEEIHT et INSA Toulouse |
Le tableau ci-dessus correspond à un semestre de cours. Le second semestre, entre début avril et septembre, sera dédié à un stage en entreprise d’une durée de 5 à 6 mois, qui donnera lieu à la rédaction d’une thèse professionnelle.
Les aspects éthiques, juridiques et déontologiques (confidentialité des données, biais et explicabilité des algorithmes, dependable IA), seront abordés au travers d’un cycle de conférences.
Les UE Projet transverse et Learning par étude de cas seront entièrement dispensées par des industriels.
En moyenne chaque UE est composée de 50% de cours et de 50% de TP.
Débouchés
Les métiers
Les métiers ciblés par cette formation concernent toute la chaîne de stockage, traitement et valorisation des données. Ils adressent les aspects techniques liés à l’infrastructure matérielle, l’infrastructure logicielle, les algorithmes de traitement et de prédiction, la mise en valeur et exploitation des résultats.
Les principaux métiers ciblés sont les suivants :
- Data Scientist
- Data Engineer
- Data Manager
- Data Analyst
- Architecte Big Data
- Ingénieur Big Data
- Consultant Business Intelligence (informatique décisionnelle)
- Responsable du contrôle qualité
Description des activités
Les diplômés auront un spectre large de compétences en informatique et mathématiques appliquées qui leur permettra d’aborder les différentes fonctions liées à la valorisation des données massives.
Ils pourront en particulier :
- proposer et développer les algorithmes nécessaires afin d’extraire des informations pertinentes sur de vastes ensembles de données
- créer des structures physiques et des architectures de données, afin de les rendre accessibles
- créer des systèmes de traitement de données à grande échelle et proposer des solutions pour le stockage et l’accès aux données
- superviser le flot de données de sa source à sa destination
- développer des méthodes, moyens et outils informatiques pour aider à la prise de décision
- participer à des activités de certificat.
Secteurs d’activité
Tous les secteurs industriels sont concernés par ces compétences (aéronautique, spatial, transport, énergie, télécommunications, santé…) de même que les secteurs tertiaires (banque, finance, assurance) pour l’analyse quantitative et l’aide à la décision.
Conditions d’admission
Le public
Ce mastère spécialisé s’adresse aux titulaires d’un diplôme d’ingénieur ou d’un master ou équivalent en mathématiques ou informatique. La formation sera également proposée en contrat de professionnalisation.
Les pré-requis
Il faut maîtriser une majeure partie dans un des domaines – mathématiques ou informatique – et une capacité à élargir les compétences dans le domaine complémentaire est importante.
Mathématiques :
- Algèbre linéaire : résolution de systèmes linéaires, espaces vectoriels, applications linéaires, vecteurs propres, valeurs propres, calcul matriciel, diagonalisation.
- Analyse : suite et séries, intégration, calcul différentiel, analyse de Fourier
- Optimisation : gradient, algorithmes de descente de gradient, Lagrangien, programmation linéaire (simplexe, dualité, analyse de sensibilité)
- Probabilités : lois usuelles, indépendance, probabilité conditionnelle, théorème de la limite centrale, vecteurs gaussiens
- Statistique : estimation ponctuelle, méthode du maximum de vraisemblance, intervalles de confiance, tests d’hypothèses, modèle linéaire, estimation par moindres carrés
Informatique :
- Algorithmique et structures de données
- Variables, types primitifs (entiers, caractères, booléens, flottants), structures de contrôles, fonctions,
- Tableaux, listes, piles files, arbres, graphes
- Algorithmes itératifs et récursifs de tri, parcours, recherche et évaluation de la complexité d’algorithmes
- Concepts de programmation orientée objet
- Classes, objets, méthodes, attributs, encapsulation
- Héritage, polymorphisme, classes abstraites, interfaces
- Expérience de développement dans un langage objet type Java ou C++ et en Python
- Connaissance d’environnements de développement (par exemple IntelliJ, Eclipse, Anaconda, etc.)
- Implémentation d’algorithmes numériques ou non numériques
- Utilisation de bibliothèques standards
- Chaines de caractères, types énumérés, entrées/sorties
- Gestion des erreurs et des exceptions
- Tests unitaires
- Connaissance d’un outil de gestion de version (par exemple Git)
- Systèmes Informatiques
- Architecture matérielle des ordinateurs : codage des données, modèle de Von Neumann
- Systèmes d’Exploitation (par exemple Linux) : processus, mémoire, entrées/sorties, systèmes de fichiers, commandes système de gestion des processus et des ressources, programmation concurrente
- Réseaux : infrastructures, modèle internet, programmation réseau, protocoles de routage
L’admission
La sélection des étudiants se fait dans un premier temps sur dossier, à partir des résultats obtenus en M1, M2 ou années équivalentes des écoles d’ingénieur ou de l’université.
La seconde phase consiste en un entretien avec présentation du projet professionnel devant un jury constitué d’enseignants de la formation et de représentants d’entreprises.
Les tarifs
Étudiants : 9 000 €
Salariés : 12 000 €
Demandeurs d’emploi : contacter le Service Formation Continue
Pour candidater
Un seul dossier à soumettre en ligne :
- CV
- Pièce d’identité
- derniers diplômes
- bulletins de notes de Master 1 et 2 (ou équivalents)
- 2 lettres de recommandation
- 1 lettre de motivation
Frais d’instruction de dossier : 95 €, paiement en ligne (lien affiché sur eCandidat)
Déposer votre dossier de candidature en ligne : https://candidatures.insa-toulouse.fr
Pour les candidats hors UE, une procédure parallèle avec Campus France sera potentiellement nécessaire pour l’obtention de votre VISA.
Les dates à retenir
- Dossiers de candidature : du 1er mars au 30 juin
- Rentrée universitaire mi-septembre
- Fin de la formation : fin septembre
Contact
Béatrice
Laurent Bonneau

INSA Toulouse
135 avenue de Rangueil
31077 Toulouse cedex 4
Tél : 05 61 55 95 13
Fax : 05 61 55 95 00

Dans un souci d'alléger le texte et sans aucune discrimination de genre, l'emploi du genre masculin est utilisé à titre épicène.