Télécom ParisTech

Actualité

Illustration de l'actualité : Soutenance de doctorat de Pierre-Alexandre Murena : Principe de minimum de complexité pour le transfert de connaissances en apprentissage artificiel

Soutenance de doctorat de Pierre-Alexandre Murena : Principe de minimum de complexité pour le transfert de connaissances en apprentissage artificiel

vendredi
14
décembre
2018

PhD Comics : I'm defending my thesis, Mom !

Jury

  • Antoine CORNUÉJOLS, AgroParisTech (co-encadrant)
  • Jean-Louis DESSALLES, Télécom ParisTech (co-encadrant)
  • Shai BEN DAVID, University of Waterloo (rapporteur)
  • Amaury HABRARD, Université Jean Monnet (rapporteur)
  • Florence D'ALCHÉ-BUC, Télécom ParisTech (examinatrice)
  • Jean LIEBER, Université de Lorraine (examinateur)
  • Laurent ORSEAU, Google Deepmind (examinateur)
  • Gilles RICHARD, Université Paul Sabatier (examinateur)

Résumé

Les méthodes classiques d'apprentissage automatique reposent souvent sur une hypothèse simple mais restrictive: les données du passé et du présent sont générées selon une même distribution. Cette hypothèse permet de développer directement des garanties théoriques sur la précision de l'apprentissage. Cependant, elle n'est pas réaliste dans un grand nombre de domaines applicatifs qui ont émergé au cours des dernières années.
Dans cette thèse, nous nous intéressons à quatre problèmes différents en intelligence artificielle, unis par un point commun: tous impliquent un transfer de connaissance d'un domaine vers un autre. Le premier problème est le raisonnement par analogie et s'intéresse à des assertions de la forme « A est à B ce que C est à D ». Le second est l'apprentissage par transfert et se concentre sur des problèmes de classification dans des contextes où les données d'entraînement et de test ne sont pas de même distribution (ou n'appartiennent même pas au même espace). Le troisième est l'apprentissage sur flux de données, qui prend en compte des données apparaissant continument une à une à haute fréquence, avec des changements de distribution. Le dernier est le clustering collaboratif et consiste à faire échanger de l'information entre algorithmes de clusterings pour améliorer la qualité de leurs prédictions.
La principale contribution de cette thèse est un cadre général pour traiter les problèmes de transfert. Ce cadre s'appuie sur la notion de complexité de Kolmogorov, qui mesure l'information continue dans un objet. Cet outil est particulièrement adapté au problème de transfert, du fait qu'il ne repose pas sur la notion de probabilité tout en étant capable de modéliser les changements de distributions. En plus de cet effort de modélisation, nous proposons dans cette thèse diverses discussions sur d'autres aspects ou applications de ces problèmes. Ces discussions s'articulent autour de la possibilité de transfert dans différents domaines et peuvent s'appuyer sur d'autres outils que la complexité.