Télécom ParisTech

Actualité

Illustration de l'actualité : Soutenance de thèse d'Albert Thomas : Détection d'anomalies en contexte non supervisé

Soutenance de thèse d'Albert Thomas : Détection d'anomalies en contexte non supervisé

vendredi
6
octobre
2017

PhD Comics : I'm defending my thesis, Mom !

Jury

  • Patrice BERTAIL, Professeur, Université Paris Ouest (Examinateur)
  • Gilles BLANCHARD, Professeur, Universität Potsdam (Rapporteur)
  • Stéphan CLEMENCON, Professeur, Télécom ParisTech (Directeur de thèse)
  • Vincent FEUILLARD, Ingénieur-Chercheur, Airbus Group (Encadrant industriel)
  • Alexandre GRAMFORT, Maître de conférence, Télécom ParisTech (Co-directeur de thèse)
  • Céline LEVY-LEDUC, Professeur, AgroParisTech (Examinateur)
  • Jean-Philippe VERT, Directeur de Recherche, Mines ParisTech (Rapporteur)
  • Anne SABOURIN, Maître de conférence, Télécom ParisTech (Examinateur)

Résumé

La détection d’anomalies en contexte non supervisé consiste à détecter les événements les plus anormaux dans un ensemble de données ne contenant pas d’information a priori sur leur normalité ou leur anormalité. Dans ce contexte, l’hypothèse implicite est de considérer qu’une anomalie correspond à un événement rare et que les anomalies sont localisées dans les régions de faible densité. La plupart des algorithmes de détection d’anomalies non supervisé retourne en sortie une fonction de score qui associe un score à chaque donnée : plus le score est petit plus la donnée est considérée comme anormale. En l’absence de données labellisées, il est difficile d’évaluer la performance des algorithmes de détection d’anomalies non supervisés. Ce travail introduit la courbe Masse Volume, un critère fonctionnel qui permet d’évaluer la performance d’une fonction de score retournée par un algorithme de détection d’anomalies non supervisé. Après avoir étudié l’estimation statistique de ce critère, la courbe Masse Volume est utilisée pour la construction d’une fonction de score et pour l’apprentissage des hyper- paramètres des algorithmes de détection d’anomalies non supervisés. Enfin, la détection d’anomalies en contexte non supervisé est aussi confrontée à la rareté des données dans les régions de faible densité. Une approche basée sur la théorie des valeurs extrêmes est suggérée afin d’aborder cette difficulté dans les régions extrêmes.