Télécom ParisTech

FAQ (Foire aux Questions) - MS Big Data

Points fortsProgrammeCarrières/TémoignagesFAQAdmissionBrochure/Contact

Les questions / réponses sont classés en 5 thèmes, également abordés dans les vidéos ci-dessous. N'hésitez pas à nous contacter si vous avez des questions dont vous ne trouveriez pas la réponse ici.

James Eagan, enseignant-chercheur co-responsable du MS Big Data et Yoann Janvier, diplômé, en direct sur Campus Channel 
Interview de Stephan Clémençon, co-responsable du MS Big Data :  « Pourquoi un MS Big Data ? »

Prérequis et admission

Le Mastère Spécialisé® Big Data possède une couverture disciplinaire large, elle se veut exhaustive et englobe notamment les aspects sociétaux, juridiques et économiques. Mais il traite avant tout des questions techniques, des outils informatiques et des méthodes mathématiques. Il est donc nécessaire d’avoir des bases en mathématique, en informatique et en statistique pour pouvoir s’exprimer dans les codes de la formation. La plupart des enseignements en machine learning se font en python. Cependant, il n’est pas nécessaire d’être un expert en python en arrivant dans le Mastère Spécialisé®. Nous demandons un socle de connaissances mathématiques indispensables pour pouvoir suivre un enseignement formel.

Le Mastère Spécialisé® Big Data n’est pas un enseignement où on apprend simplement des briques technologiques qui peuvent être très vite obsolètes. Nous préférons transmettre un certain nombre de connaissances pour être capable de progresser, car c’est un champ qui évolue très vite. Avoir le langage formel avec un niveau de licence solide en mathématique, des bases en calcul numérique, probabilité, statistique et optimisation est indispensable.

La formation est progressive. Il ne s’agit pas d’attaquer dès au début du cursus les concepts avancés en mathématique ou en informatique. Le premier trimestre se focalise sur des séances de remise à niveau. Les élèves travaillent en groupe, les plus à l’aise en mathématique aident les autres.

Nous proposons un MOOC « Fondamentaux pour le Big Data »  sur la plateforme France Université Numérique (FUN) qui permet d’évaluer son niveau. Si un candidat le valide, il a le niveau suffisant pour suivre la formation de Mastère Spécialisé®.

Les cours de Télécom ParisTech s’étalent sur neuf mois (de fin septembre à fin juin). Aujourd’hui, Télécom ParisTech a une approche très exhaustive pour former quelqu’un qui deviendra un data scientist. Le savoir-faire de l’école dans le domaine du machine learning et des mathématiques appliquées est reconnu et compétitif au niveau de la recherche, en plus elle s’adjoint les services et le regard des industriels.

Télécom ParisTech possède aussi un incubateur. L’Ecole collabore avec des personnes compétentes, capables d’être multi facettes et multi tâches, et qui ont le pouvoir de mettre en œuvre toutes les compétences dans le domaine de la science des données, de l’acquisition des données à la production d’un service. Des éléments que l’on peut découvrir de façon très exhaustive dans la formation, qui est très dense. Il n’est pas nécessaire de prévoir d’autres sujets à aborder en parallèle de la formation.

Nous recherchons une certaine variété et une diversité en termes d’expérience professionnelle pour la trentaine d’étudiants formant la promotion. On peut par exemple trouver dans la promotion de cette année des étudiants qui ont une quinzaine, voire une vingtaine d’années d’expérience professionnelle et qui apportent de la valeur en termes de partage d’expérience, de recul dans la gestion de projets. Il y a aussi beaucoup d’étudiants en poursuite d’études après un Master 2.

Nous recherchons des personnes qui ont impérativement des compétences en informatique et en mathématique. Nous avons également besoin des candidats curieux, motivés, et qui ont une passion pour les données. Des personnes qui veulent comprendre comment on met en place les systèmes d’analyse et découvrir ce qui est caché dans les données. Ils doivent avoir une démarche de recherche, être capable de lire des articles scientifiques.

Enfin, beaucoup d’importance est accordée pendant l’entretien à la cohérence du projet professionnel. Il faut être capable de se projeter et d’avoir une démarche cohérente.

Il est indispensable d’avoir une expérience de la programmation pour suivre ce cursus. Cependant nous ne sommes pas une école de programmation, il n’est pas obligatoire d’être un véritable développeur. Il est possible par exemple de se préparer en suivant un MOOC pour se remettre à niveau. La formation vise plutôt à comprendre dans le détail les concepts et à exploiter les briques technologiques actuelles : services Cloud, environnements pour faire de la recherche dans des bases de données peu structurées, plateformes de stockage distribué, etc.

Une soixantaine. Suite à l'engouement suscité par la formation ces deux dernières années, nous avons mis en œuvre des moyens supplémentaires afin accueillir plus d’étudiants dans de bonnes conditions d’encadrement. En effet, il y a une majorité d’enseignants-chercheurs qui interviennent dans la formation, nous ne faisons appel à des intervenants extérieurs que sur certaines matières spécifiques. Nous avons donc recruté des enseignants-chercheurs dans différentes disciplines afin de pouvoir conserver cette spécificité de la formation.

Pour postuler au Mastère Spécialisé® il faut être titulaire de l’un des diplômes suivants :

  • diplôme d’ingénieur en informatique ou en télécommunications,
  • master universitaire scientifique ou technique, en informatique ou en mathématiques appliquées,
  • diplôme (bac+4) scientifique ou technique en informatique ou mathématiques appliquées et au moins 3 ans d’expérience professionnelle,
  • diplômes étrangers de niveau équivalent à (bac+5), MSc ou MBA, en informatique ou mathématiques appliquées.

En raison du grand nombre de dossiers reçus, il ne nous est pas possible de pré-évaluer les dossiers ou de faire passer des entretiens avant le processus de recrutement. Nous vous conseillons de lire attentivement cette FAQ avant de vous décider à postuler. Vous pouvez également consulter les interviews de trois étudiants du Mastère Spécialisé® :

Le TOEIC n’est pas obligatoire. Cependant, il vaut avoir un niveau suffisant pour pouvoir suivre les cours dispensés en anglais, qui est la langue de la technologie et de la science, donc indispensable pour pourvoir lire un article scientifique. Par conséquent, si on a le TOEIC c’est mieux, dans le cas contraire, il faut pouvoir prouver son niveau en anglais, avec des relevés de notes par exemple.

Contenu de la formation et déroulement de l’année

Il y a au total 720 heures de cours, dont des cours magistraux pendant lesquels le professeur fait un discours en présentant un domaine. S’y ajoutent beaucoup de travaux pratiques sur toute l’année. Les salles de travaux pratiques sont bien équipées. L’Institut Mines-Télécom s’est doté d’une plateforme, Teralab, sur laquelle les étudiants peuvent travailler, en plus des plateformes commerciales de type Amazon Web Services.

Il y a également tous les jeudis un séminaire professionnel qui donne la possibilité aux élèves d’interagir avec des entreprises qui sont aussi des futurs recruteurs. Il permet de faire découvrir les enjeux du Big Data dans de nombreux domaines (Santé, finance, énergie, marketing…). Des salons sont organisés à Télécom ParisTech, comme le Forum des Mastères Spécialisés au mois de mars, et les élèves sont invités aux salons Big Data Paris en mars et DataJob en novembre.

Enfin les élèves peuvent interagir avec les élèves ingénieurs, avec qui ils partagent certains des cours.

Il existe un département de Sciences économiques et sociales (SES) à Télécom ParisTech et en particulier une Chaire de recherche liée aux Valeurs et Politiques des Informations Personnelles , où on s’interroge sur la valorisation des données, sur les questions liées à la vie privée et aux aspects juridiques.

Nous avons trois cours supervisés par le département SES. Un cours autour des données Internet où il est question de propriété intellectuelle et de droit, un cours sur l’écosystème Big Data avec beaucoup d’intervenants extérieurs, des grands groupes comme des start-up et des institutions gouvernementales pour réfléchir à la création de valeurs à partir des données, et un cours plus spécifique sur l’économétrie du Big Data.

Il y a aussi un séminaire professionnel tous les jeudis où on fait venir des représentants de divers secteurs d’activités : la santé, la défense, l’e-commerce, la finance, l’assurance… pour partager avec les étudiants leurs expériences de gestion du Big Data. Cette partie valorisation économique est très présente dans la formation, qui reste par ailleurs très technique.

C’est un séminaire qui n’est pas technique. Sur le site web de la chaire Machine Learning for Big Data , il y a un résumé de la majorité des sessions. L’idée est de donner la parole à une entreprise qui vient présenter un domaine, un enjeu du Big Data. Cet enjeu peut être lié à des plateformes de calcul pour expliquer les différents systèmes, l’architecture de géomarketing, la cybersécurité, la défense, la finance, la santé, les nouvelles technologies, etc. C’est aussi une façon pour les entreprises de se retrouver en face de recrues potentielles.

Dans l’écosystème de la formation Big Data  à Télécom ParisTech il y a des consultants, des Chiefs Data Officers, des personnes qui viennent expliquer ce qui est véritablement un projet, comment ça s’articule, comment on part des besoins, des contraintes pour arriver à un service ou à un produit. Il n’y a pas de cours de management, la formation en management se passe beaucoup via l’exemple, le stage et les projets. En revanche il y a des cours de droit et d’économie.

Nous ne considérons pas être dans un secteur concurrentiel : pour offrir une bonne formation Big Data, il faut vraiment s’affranchir du carcan disciplinaire, être capable d’articuler un enseignement qui fait intervenir les mathématiques, de l’informatique, du business, de l’économie, du droit et il faut une proximité incontournable avec l’industrie.

En France, cela ne peut se faire aujourd’hui qu’au niveau d’une école d’ingénieur comme Télécom ParisTech et c’est là qu’est notre background et notre légitimité. L’une des particularités de Télécom ParisTech, c’est que ses chercheurs travaillaient déjà en étroite collaboration avec les entreprises avant l’émergence du concept du Big Data. Télécom ParisTech avait donc déjà une expérience et une crédibilité dans ces domaines. Il suffit de regarder par exemple la liste non exhaustive des publications  de nos enseignants chercheurs sur le site de la chaire Machine Learning for Big Data.

Chacun des modules est évalué individuellement, le diplôme est validé si l’on obtient suffisamment de crédits ETCS. Les modalités d’évaluation sont variées : contrôle continu, challenge, projet ou combinaisons de ces différents modes. L’évaluation vise avant tout à la vérification de la compréhension des concepts et de leur application opérationnelle.

Les cours s’étalent sur 9 mois, d’octobre à juin, pour un total de 720 heures. Les journées durent de 8h30 à 17h environ. Mais la quantité de travail personnel est très importante : on attend que chaque élève fournisse un temps de travail personnel équivalent. Il y a également des travaux de groupe qui s’étalent sur plusieurs trimestres. Un temps dans la semaine est réservé au travail personnel ou en groupe.

La période de stage (thèse professionnelles) dure ensuite entre 4 mois minimum et 6 mois, à partir du mois de juin.

Il n’est pas envisageable d’avoir une activité en parallèle du Mastère Spécialisé®, il s’agit véritablement d’une formation à temps complet. Les personnes qui ne seraient pas 100% disponibles peuvent plutôt s’orienter vers le Certificat d’études spécialisées (CES) « Data Scientist » .

Stages, projets et thèses professionnelles

Le « projet fil rouge » vise à faire soutenir un projet professionnel. Il est indépendant du stage de fin de cursus. C’est un projet qui se réalise en groupe (4 à 5 étudiants) et en parallèle des cours, une journée et demi de travail par semaine sur trois trimestres.

Les groupes travaillent en mode gestion de projet mais les notes sont individualisées. Ces projets sont apportés et encadrés par des entreprises et s’appuient sur une problématique concrète et des données réelles. L’objectif est de permettre aux étudiants d’aborder toutes les facettes du Big Data : acquisition, stockage, analyse, assortie d’une réflexion sur la propriété des données, notamment les questions de droit.

Le stage de fin de cursus est complètement individualisé et dure 4 à 6 mois. Il vise à la rédaction d’une thèse professionnelle et peut être réalisée dans le cadre d’un CDI.

Elles sont en général confidentielles parce qu’elles touchent à des aspects qui sont très stratégiques pour les entreprises. Il y a eu des thèses professionnelles dans le domaine du consulting, ou très technologiques, liées à l’énergie par exemple, ou encore sur comment monter une plateforme Big Data, développer une solution et la mettre en web service. Il y a également des thèses qui sont plus liées à la réflexion et à l’organisation, comme construire un moteur de recommandation par exemple. C’est extrêmement varié.

Entreprises partenaires

Il y a beaucoup de partenaires industriels dans le comité de perfectionnement qui gère l’organisation et la connaissance du Mastère Spécialisé®. Il faut également savoir que la recherche à Télécom ParisTech est financée quasiment exclusivement par des contrats. Ce sont des industriels et des mécènes qui financent les trois Chaires de recherche sur lesquelles s’adosse cette formation : la chaire Machine Learning for Big Data , la chaire Valeurs et Politiques des Informations Personnelles  et la chaire Big Data & Market Insights .

Télécom ParisTech apporte son savoir aux entreprises en formant des experts répondant aux besoins du marché. En retour les entreprises viennent nous parler de leur vision dans le cadre du séminaire du Big Data qui se tient tous les jeudis à Télécom ParisTech. Elles viennent expliquer comment le Big Data impacte l’organisation de leur DSI, les nouveaux marchés, et comment ils essayent d’anticiper les questions.

Elles peuvent intervenir aussi dans les cours en présentant des points techniques comme dans le domaine de la cybersécurité et de la biométrie. Elles peuvent mettre leurs données à disposition dans le cadre de challenges notés. Elles proposent et encadrent des sujets pour les projets fil rouge, pendant lesquels les élèves ont accès aux données réelles des entreprises. Dans le même temps, ils perçoivent les réalités du terrain. Enfin elles proposent une grande quantité de stages dans des domaines très variés.

Débouchés

Un Mastère Spécialisé® est une formation de niveau Bac+6, accessible après avoir validé un Master. Ce type de formation est agréé par la Conférence des grandes écoles . Une dizaine d’entreprises (Thales, Safran, Airbus, Orange…) sont membres du comité de perfectionnement du Mastère Spécialisé® Big Data ce qui permet que ses contenus restent toujours en adéquation avec les besoins des entreprises.

D’un point de vue notoriété, la première promotion a déjà fait ses preuves au sein d’entreprises variées (grands groupes internationaux comme start-ups). Les étudiants reçoivent toutes les semaines des propositions de stage ou d’embauche.

Après leur formation, les élèves ont tellement d’offres qu’ils se permettent de choisir. Chaque semaine les entreprises nous envoient une quinzaine ou vingtaine d’offres de stage, de CDD ou de CDI. Evidemment le Big Data vient des grandes masses de données et son succès a d’abord été connu dans le secteur de l’internet, aussi est-ce le domaine le plus demandé. Mais aujourd’hui il y a un transfert dans tous les secteurs d’activités : énergie, transport, banque, commerce, sécurité, défense, police scientifique…

En data science, on a besoin d’un savoir-faire et de connaissances techniques au départ pour savoir ce qu’il est possible de faire. En général, les personnes qui accèdent aux postes stratégiques de management ont un background technique complètement incontournable. Aujourd’hui, les sciences et techniques de l’information et de la communication sont en train de révolutionner beaucoup de secteurs d’activités, il est donc indispensable de commencer par une formation technique pour aborder le Big Data.

Au contraire, c’est un domaine pluridisciplinaire. Au-delà de la dynamique informatique/mathématiques, on y adjoint des compétences comme le droit et l’économie, le design avec la data visualisation, ainsi que la gestion de projet, le management… Mais il y a aussi la composante « métier » qui est très importante. Il est impossible d’être data scientist sans tenir compte de l’activité de l’entreprise, de son cœur de métier, pour avoir une action efficace et monter des projets qui tiennent la route. Le data scientist, ou chief data officer, doit pouvoir dialoguer avec toutes les composantes de l’entreprise. Il peut être acteur de l’innovation et de la stratégie. C’est donc loin d’être une discipline « enfermante ».

Au contraire, c’est un domaine pluridisciplinaire. Au-delà de la dynamique informatique/mathématiques, on y adjoint des compétences comme le droit et l’économie, le design avec la data visualisation, ainsi que la gestion de projet, le management… Mais il y a aussi la composante « métier » qui est très importante. Il est impossible d’être data scientist sans tenir compte de l’activité de l’entreprise, de son cœur de métier, pour avoir une action efficace et monter des projets qui tiennent la route. Le data scientist, ou chief data officer, doit pouvoir dialoguer avec toutes les composantes de l’entreprise. Il peut être acteur de l’innovation et de la stratégie. C’est donc loin d’être une discipline « enfermante ».

L’insertion des diplômés est extrêmement facile. Télécom ParisTech est en train de recruter sa troisième promotion cette année. Tous les étudiants de la première promotion ayant soutenu leur thèse ont trouvé un emploi à la suite de leur stage. Ils ont été officiellement diplômés en mars 2015. Les tuteurs industriels de cette première promotion ont été dans la quasi-totalité extrêmement satisfait de leur travail et leur ont proposé un poste. Certains ont même commencé directement en CDI à la place du stage et d’autres ont monté leur entreprise.

Un jeune formé via ce Mastère Spécialisé® pourrait sans peine trouver autour de 45k € annuel, et beaucoup plus pour ceux qui ont une expérience professionnelle. Pour la première promotion, les salaires de ceux qui ont répondu à notre enquête annuelle s’étalent entre 50 et 80 k€ annuel.