Traitement des données manquantes
à l’Ined, salle Sauvy de 14h à 17h
Imputation, MIVQUE et préservation des relations entre variables Les données manquantes représentent souvent un cauchemar pour tout statisticien confronté à une analyse de ses données. La non-réponse dans les enquêtes peut en effet affecter significativement les estimateurs calculés.
Après avoir défini différents types de non-réponse rencontrés dans les fichiers d’enquêtes, cette séance se propose de présenter dans un premier exposé quelques solutions à mettre en œuvre pour la correction de non-réponse. Le cas des données manquantes en analyse de données sera ensuite présenté dans le cas de variables catégorielles, par adaptation de l’algorithme NIPALS. Enfin, un dernier exposé présentera la mise en œuvre d’une méthode d’imputation jointe, par régression aléatoire, visant à préserver les relations entre variables tout en évitant la variance dite d’imputation.
- Guillaume CHAUVET (Ensai (Crest))Exposé introductif : Méthodes de correction de la non-réponse dans les enquêtes
- Christian DERQUENNE (EDF R&D - Département OSIRIS) : Données manquantes et algorithme NIPALS : le cas des variables catégorielles
- Brigitte GELEIN (Ensai) : Imputation, MIVQUE et préservation des relations entre variables