Télécom ParisTech

Le Big Data à Télécom ParisTech : filière Big Data – Data Scientist – Machine Learning

Le big data est une priorité nationale fixée par le Plan Big Data  de 2013 qui vise à faire de la France la référence mondiale dans ce domaine, notamment via la formation de data scientists. Il se retrouve à l’honneur dans le Programme Horizon 2020 . Enfin, le programme Industrie du futur a défini en mai 2015 trois priorités connexes : l’économie des données, les objets intelligents et la confiance numérique.

Le big data est l’un des six grands axes structurants de Télécom ParisTech, transverse à ses quatre départements d’enseignement-recherche. Élément clé de son rayonnement international, il résonne au travers de ses trois missions : formation, recherche et innovation. Le dynamisme de la filière big data à Télécom ParisTech découle d'une recherche unique en Europe qui s’articule autour de nombreuses disciplines : électronique, informatique, mathématiques et statistiques, sciences économiques et sociales.

L’École anime trois Chaires de recherche et d’enseignement autour du big data, propose de nombreux cursus en formation initiale et continue et encourage l’innovation. La thématique concerne 50 enseignants-chercheurs, 50 doctorants et une centaine de diplômés par an.

Forces disciplinaires de recherche en Big Data

Nombre d'enseignants-chercheurs et doctorants en Image Données Signal, Communications Électronique, Informatique Réseaux, Sciences Économiques et SocialesBig data par départements : Image Données Signal, Communications Électronique, Informatique Réseaux, Sciences Économiques et Sociales

Télécom ParisTech, en partenariat avec des entreprises et avec le soutien de la Fondation Télécom, s’investit dans trois Chaires liées au domaine du Big Data au sein de son groupe, l’Institut Mines-Télécom.

Machine Learning for Big Data 

Pilotée par le professeur Stephan Clémençon, la Chaire MLBD conduit ses recherches à l'interface des mathématiques et de l'informatique. Le machine learning vise à élaborer des algorithmes permettant à des machines d’apprendre automatiquement à partir des données et ainsi améliorer leurs performances. Quatre entreprises en sont partenaires : Criteo, PSA Groupe, Safran et BNP Paribas.

Big Data & Market Insights 

Créée en partenariat avec Télécom École de Management et portée par le professeur Talel Abdessalem, la chaire BDMI regroupe des chercheurs spécialisés dans les fondements de la gestion et la fouilles de données massives, l'extraction de connaissances à partir du Web et l’analyse de réseaux sociaux. Elle est financée par Groupe BPCE et SNCF.

Valeurs et politiques des informations personnelles 

La Chaire de l’IMT (Institut Mines-Télécom) bénéficie du mécénat du Groupe Imprimerie Nationale, BNP Paribas, Orange, LVMH, Dassault Systèmes et des partenariats avec la CNIL et la DINSIC. Elle est coordonnée par Claire Levallois-Barth, maître de conférences en droit, et traite des aspects juridiques, techniques, économiques et philosophiques qui concernent la collecte, l’utilisation et le partage des informations personnelles.

Machine Learning for Big Data

Créée en 2013 et pilotée par le professeur Stéphan Clémençon, la Chaire conduit ses recherches à l'interface des mathématiques et de l'informatique. Le Machine Learning vise à élaborer des algorithmes permettant à des machines d’apprendre automatiquement à partir des données et ainsi améliorer leurs performances. Quatre entreprises en sont partenaires : Criteo, PSA Peugeot Citroën, Safran et BNP Paribas.

Cycle Ingénieur : filière « Science des données »

La filière Sciences des Données couvre l'ensemble des domaines liés à l'exploitation, la gestion et l'analyse de grands volumes de données, structurées et non structurées. Des exemples de débouchés naturels sont les métiers de data scientist ou analyste des données, d'ingénieur statisticien, d'administrateur de bases de données, ou les domaines de recherche et R&D en apprentissage statistique, gestion de données, extraction de données, fouille de données, mathématiques de l'apprentissage.

Master 2 « DataScience » 

Co-habilité avec l’Ecole polytechnique et première formation de niveau Master en big data associant plusieurs acteurs académiques majeurs, ce Master Recherche vise un public d’étudiants désireux d’approfondir les mathématiques appliquées dans le champ de la Science des Données, en relation avec les briques technologiques permettant le « passage à l’échelle ». Visant à un équilibre entre mathématiques et informatique, ce Master est aussi très appliqué via des études de cas proposées par les entreprises.

Master 2 Informatique, parcours « Data & Knowledge »  et « DataScale » 

Télécom ParisTech participe à deux parcours du Master Informatique de l’Université Paris-Saclay. Le parcours « Data & Knowledge », entièrement en anglais, permet aux étudiants d’intégrer des entreprises internationales et des organismes de recherche de premier rang mondial. Le parcours « Gestion de données dans un monde numérique » (DataScale) présente des débouchés dans le secteur de l’industrie, des services, de la recherche et de la R&D.

Mastère Spécialisé « Big Data : gestion et analyse des données massives »

Premier Mastère Spécialisé®  sur le big data en France, c’est un cursus professionnalisant qui s’adresse à des diplômés en poursuite d’études ou en reconversion. Il propose 9 mois de cours, travaux pratiques et séminaires, ainsi qu’un projet « fil rouge » supervisé par une entreprise. Il se conclut par un stage de 4 à 6 mois et la soutenance d’une thèse professionnelle.

CES (Certificat d’Etudes Spécialisées) « Data Scientist » 

Le CES proposé par Télécom Évolution  est destiné aux professionnels désireux d’accroître leurs compétences dans le domaine de la science des données (stockage, représentation, analyse statistique, visualisation). Très opérationnelle, avec 12 sessions de 2 jours répartis sur une période de 10 mois, la formation vise à maîtriser les techniques de gestion et d’analyse des big data et des principaux algorithmes du machine learning.

MOOC « Fondamentaux pour le Big Data » 

Ce MOOC prépare au suivi des formations dans le domaine du big data. Les compétences visées constituent un préalable indispensable dans les domaines de l’analyse, de l’algèbre, des probabilités, des statistiques, de la programmation Python et des bases de données. Le MOOC, composé de 7 parties, se déroule sur 6 semaines.

Stages courts 

Télécom Évolution propose 10 formations courtes (1 à 5 jours) focalisées sur des compétences précises : infrastructures et architectures distribuées, data science et machine learning, sécurité, visualisation, Web sémantique, extraction de données, data science dans le cloud, le langage R… Un module de deux jours initie les non-spécialistes aux enjeux économiques, juridiques et techniques du big data.

Executive MBA « Data Scientist des Métiers de l'Assurance » 

Conçu en partenariat avec l’École Polytechnique d’Assurances, cet Executive MBA s’adresse à des ingénieurs, techniciens, chefs de projet, informaticiens, statisticiens, mathématiciens souhaitant développer leurs compétences et encadrer des équipes spécialisées dans le domaine du big data appliqué à l’assurance. La formation compte 67 jours en présentiel sur 13 mois et repose sur 4 piliers : technique (Data Science et assurance), stratégique, éthique et management.

ParisTech Entrepreneurs

L’incubateur de Télécom ParisTech a accueilli en 15 ans plus de 300 start-up innovantes du numérique. Beaucoup d’entre elles utilisent les technologies du big data. Dans l’analyse et le traitement des données : Invenis, Lefty, Datapred, Linkurious, DCbrain, Predictice. Dans le marketing et le e-commerce : Botfuel, Adomik, Vigicolis, Catalisio, Beyable. Dans l’industrie et les transports : iDMog, Safety Line. Dans la santé : Dreamquark. Dans l’innovation et la hight-tech : Stim, L2 Technologies, Sevenhugs. Dans les services Internet : Ownpage, FocusMatic. [plus d'infos sur ces start-up].

Focus sur quatre jeunes pousses incubées actuellement :

Botfuel
  • Botfuel  développe et commercialise une plateforme de développement de « chatbots » à destination des entreprises qui cherchent à transposer un service existant sous forme conversationnelle. La plateforme de Botfuel cible les besoins qui ne sont pas bien couverts par les plateformes destinées à une plus large audience : gestion des conversations complexes, montée en charge, testabilité, internationalisation et confidentialité des données.
Predictice
  • Predictice  propose un outil d’aide à la décision destiné aux professionnels du droit. Son objectif est d’accroître la transparence, la prédictibilité et la performance de la Justice et de ses acteurs. Son algorithme de justice prédictive permet de calculer facilement les chances de succès d’un litige, le montant des indemnités ou d’identifier les éléments les plus influents. La solution permet également d’accéder à la jurisprudence et aux textes de loi via une barre de recherche en langage naturel.

DC Brain
  • DC Brain  a développé une solution de visualisation de l’activité électrique des data centers sous forme de graphique pour permettre une meilleure gestion des dépenses et apporter une réponse concrète à ces problématiques de dépenses énergétiques.  L’objectif est d’optimiser les flux et les consommations, identifier les anomalies et simuler les évolutions sur le réseau. D’autres types de flux peuvent également être supervisés grâce à la technologie de DCbrain.

Invenis
  • Invenis  est un logiciel d’analyse big data qui permet aux entreprises d’accéder à l’ensemble de leurs données structurées et de disposer d’une bibliothèque de modules de traitement incluant des algorithmes de machine learning. À la fois ouvert à tous, évolutif et facile à déployer dans une structure, les bénéfices de son utilisation en termes de gain de temps et de coûts sont considérables.
Teralab

La plateforme Teralab 

Teralab est la première plateforme big data sponsorisée par l'État français. Issue du Plan d'investissements d'avenir, elle a pour objectif de doter l’innovation, la recherche et l’enseignement  d'importantes capacités de traitement, pour favoriser l’adoption des technologies big data. Elle est pilotée par l’IMT et le GENES en partenariat avec l’INSEE.

Teralab est une infrastructure puissante, flexible et de confiance. Chaque projet évolue dans un espace cloisonné et sécurisé, les données les plus sensibles étant protégées par une identification biométrique. L’équipe Teralab est appuyée par des chercheurs reconnus dans l’analyse des données et le machine learning. Elle aide ses utilisateurs à choisir le format de projet le plus adapté à leur besoin : projet collaboratif, projet européen, challenge, proof of concept… ainsi que l’accompagnement juridique adéquat.

Big Data News

Abonnez-vous !

Actus Big Data