Données du Web : questions et pratiques en SHS
Vendredi 12 février 2021 (14h-17h) en visio conférence
Pour de nombreuses disciplines les données du Web représentent une source inédite et pléthorique. En sciences sociales aussi l’accès à ces données pose de multiples questions pour leur utilisation complémentaire à d’autres données plus traditionnelles, issues d'enquêtes ou de fichiers administratifs.
Au-delà de l’adéquation aux questions de recherche l'utilisation de données du Web soulève d’autres défis : technique par exemple pour le choix d'un outil adapté à l'automatisation d'une collecte dédiée, ou juridique quant à leurs bons usages pour les analyses.
Les différents exposés de cette session seront à la fois des témoignages sur l’utilisation technique de données du Web en sciences sociales, mais aussi sur les apports et contraintes dans la mise en œuvre des analyses.
- Etienne Ollion (EO, CREST) : Données du web: l’abondance et ses revers
- Marie Bergström (Ined) : (Re)faire la sociologie du couple avec des données massives
- Corentin Roquebert (ENS, Centre Max Weber) : Europresse, Youtube et Genius : retour sur trois expériences de scraping
- Julien Boelaert (CERAPS, Université de Lille) : Extraction automatique et harmonisation de données : retour sur une étude bibliométrique à partir de CAIRN
- Frederic Vergnaud (Centre de Sociologie de l’Innovation - Mines-ParisTech - PSL - CNRS UMR 9217 i3) : Le scraping de données conversationnelles avec Extractify