Données du Web : questions et pratiques en SHS

Vendredi 12 février 2021 (14h-17h) en visio conférence

Pour de nombreuses disciplines les données du Web représentent une source inédite et pléthorique. En sciences sociales aussi l’accès à ces données pose de multiples questions pour leur utilisation complémentaire à d’autres données plus traditionnelles, issues d’enquêtes ou de fichiers administratifs.

Au-delà de l’adéquation aux questions de recherche l’utilisation de données du Web soulève d’autres défis :  technique par exemple pour le choix d’un outil adapté à l’automatisation d’une collecte dédiée, ou juridique quant à leurs bons usages pour les analyses.

Les différents exposés de cette session seront à la fois des témoignages sur l’utilisation technique de données du Web en sciences sociales, mais aussi sur les apports et contraintes dans la mise en œuvre des analyses.

Programme

  • Etienne Ollion (EO, CREST) : Données du web: l’abondance et ses revers
  • Marie Bergström (Ined) : (Re)faire la sociologie du couple avec des données massives
  • Corentin Roquebert (ENS, Centre Max Weber) : Europresse, Youtube et Genius : retour sur trois expériences de scraping
  • Julien Boelaert (CERAPS, Université de Lille) : Extraction automatique et harmonisation de données : retour sur une étude bibliométrique à partir de CAIRN
  • Frederic Vergnaud (Centre de Sociologie de l’Innovation - Mines-ParisTech - PSL - CNRS UMR 9217 i3) : Le scraping de données conversationnelles avec Extractify