Télécom ParisTech

Actualité

Illustration de l'actualité : Soutenance de doctorat de Ngurah Agus Sanjaya ER : Techniques avancées pour l’extraction d’information par l’exemple

Soutenance de doctorat de Ngurah Agus Sanjaya ER : Techniques avancées pour l’extraction d’information par l’exemple

lundi
17
décembre
2018

PhD Comics : I'm defending my thesis, Mom !

Jury

  • M. Ismail Khalil - Rapporteur - Professeur, Johannes Kepler University
  • Mme Genoveva Vargas-Solar - Rapporteur - Chargé de Recherche HDR, CR CNRS HDR

  • Mme Salima Benbernou - Examinateur - Professeur, Université Paris Descartes
  • M. Pierre Senellart - Examinateur - Professeur, ENS

  • M. Talel Abdessalem - Directeur de thèse - Professeur, Télécom ParisTech
  • M. Stéphane Bressan - Co-directeur de thèse - Associate Professor, National University of Singapore

Résumé

La recherche d’information sur le Web requiert généralement la création d’une requête à partir d’un ensemble de mots-clés et de la soumettre à un moteur de recherche. Le résultat de la recherche, qui est une liste de pages Web, est trié en fonction de la pertinence de chaque page par rapport aux mots clés donnés. Cette méthode classique nécessite de l’utilisateur une connaissance relativement bonne du domaine de l’information ciblée afin de trouver les bons mots-clés. Étant donné une même requête, i.e. liste de mots-clés, les pages renvoyées par le moteur de recherche seraient classées différemment selon l’utilisateur. Sous un autre angle, la recherche d’informations trés précises telles qu’un pays et sa capitale obligerait, sans doute, l’utilisateur à parcourir tous les documents retournées et à lire chaque contenu manuellement. Cela prend non seulement du temps, mais exige également beaucoup d’efforts. Nous abordons dans cette thèse une méthode alternative de recherche d’informations, c’est-à-dire en donnant des exemples parmi les informations recherchées. Tout d’abord, nous essayons d’améliorer la précision de la recherche des méthodes existantes en étendant syntaxiquement les exemples donnés. Ensuite, nous utilisons le paradigme de découverte de la vérité pour classer les résultats renvoyés. Enfin, nous étudions la possibilité d’élargir les exemples sémantiquement en annotant (ou étiquetant) chaque groupe d’éléments des exemples.