Télécom ParisTech

Actualité

Illustration de l'actualité : Soutenance de doctorat de Samuel Goeta : Instaurer des données, instaurer des publics. Une enquête sociologique dans les coulisses de l'open data

Soutenance de doctorat de Samuel Goeta : Instaurer des données, instaurer des publics. Une enquête sociologique dans les coulisses de l'open data

jeudi
8
septembre
2016

Jury

  • Jérôme Denis - Maître assistant habilité à diriger les recherches au Centre de Sociologie de l’Innovation (Mines ParisTech) - Directeur de thèse
  • Emmanuel Didier - Chargé de recherche CNRS, directeur adjoint d’Epidapo Lab, Institute for Society and Genetics (Université de Californie à Los Angeles) - Examinateur
  • Paul N. Edwards - Professeur à la School of Information et au Department of History (Université du Michigan) - Examinateur
  • Sophie Pène - Professeure au Centre de Recherche Interdisciplinaire (Université Paris Descartes) - Rapporteure
  • Serge Proulx - Professeur émérite à l’Ecole des Médias (Université du Québec à Montréal) - Examinateur
  • Valérie Schafer - Chargée de recherche CNRS habilitée à diriger les recherches, à l'Institut des Sciences de la Communication (CNRS/Paris-Sorbonne/UPMC) - Rapporteure

Résumé

Alors que plus de cinquante pays dans le monde ont entrepris une démarche d’ouverture des données publiques, la thèse enquête sur l’émergence et la mise en œuvre des politiques d’open data. Elle repose sur l’analyse de sources publiques et sur une enquête ethnographique conduite dans sept collectivités locales et institutions françaises. Revenant sur six moments de définition de grands « principes » de l’open data et leur traduction en politique publique par une institution française, Etalab, ce travail montre comment la catégorisation par l’open data a porté l’attention sur les données, en particulier sous leur forme « brute », considérées comme une ressource inexploitée, le « nouveau pétrole » gisant sous les organisations.

L’enquête montre que le processus de l’ouverture débute généralement par une phase d’identification marquée par des explorations progressives et incertaines. Elle permet de comprendre que l’identification constitue un geste d’instauration qui transforme progressivement les fichiers de gestion de l’administration en données. Leur mise en circulation provoque des frictions : pour sortir des réseaux sociotechniques de l’organisation, les données doivent généralement passer à travers des circuits de validation et des chaînes de traitement. Par ailleurs, les données doivent souvent subir d’importantes transformations avant leur ouverture pour devenir intelligibles à la fois par les machines et par les humains. Cette thèse montre enfin que l’instauration concerne aussi les publics dont il est attendu qu’ils visualisent, inspectent et exploitent les données ouvertes. L’instauration des publics par des instruments très divers constitue un autre pan du travail invisible des politiques d’open data.

Il ressort enfin de cette thèse que l’obligation à l’ouverture des données publiques, une suite possible des politiques d’open data, pose de manière saillante une question fondamentale « qu’est-ce qu’une donnée   ? » Plutôt que de réduire la donnée à une catégorie relative, qui s’appliquerait à toutes sortes de matériaux informationnels, les cas étudiés montrent qu’elle est généralement attribuée dès lors que les données sont le point de départ de réseaux sociotechniques dédiés à leur circulation, leur exploitation et leur mise en visibilité.