Qu’est-ce qu’une donnée ? − Courrier des statistiques N5 - 2020 | Insee
▻https://www.insee.fr/fr/information/5008707?sommaire=5008710
Qu’est-ce qu’une donnée ?
Impact des données externes sur la statistique publique
Pascal Rivière, chef de l’Inspection générale, Insee
Le statisticien public utilise une matière première originale : les données. Mais outre celles qui sont issues d’enquêtes ou de déclarations administratives, il est amené à mobiliser des données d’autres natures, qui ne résultent pas toujours d’un processus d’observation. Comprendre ce matériau « data », c’est en explorer les principales dimensions, en s’appuyant sur le triplet <concept, domaine, valeur>.
Toute donnée se caractérise par un vaste faisceau de conventions (sémantique, nomenclatures, formats, etc.), et par l’infrastructure de connaissances dans laquelle elle s’inscrit, impliquant des choix qui n’ont rien de neutre. Une donnée se révèle aussi dépendante de l’environnement qui lui a donné naissance, et des processus productifs qui l’utilisent. On constate alors que les données ne sont pas pures et parfaites, ne vont pas de soi : paradoxalement, les données ne sont pas données.
Pour les besoins de la statistique publique, utiliser efficacement une telle matière requiert de démêler un entrelacs de conventions, et de construire une sorte d’appareil d’observation a posteriori , rigoureux sur les temporalités, et tenant compte de l’écosystème dans lequel la donnée externe s’inscrit.
Sommaire
Les données en statistique
La donnée : tentative de caractérisation
Encadré 1. Quelques clés sur la notion d’information
Vers une définition en trois dimensions...
... le concept associé...
... le domaine...
... la valeur
La donnée, les données...
... dans des bases, entrepôts, lacs, flux
Environnement de la donnée
Le statisticien face aux données externes
En guise de conclusion