Qu’est-ce qu’une donnée ? | Insee

/5008707

  • Qu’est-ce qu’une donnée ? − Courrier des statistiques N5 - 2020 | Insee
    https://www.insee.fr/fr/information/5008707?sommaire=5008710

    Qu’est-ce qu’une donnée ?
    Impact des données externes sur la statistique publique

    Pascal Rivière, chef de l’Inspection générale, Insee

    Le statisticien public utilise une matière première originale : les données. Mais outre celles qui sont issues d’enquêtes ou de déclarations administratives, il est amené à mobiliser des données d’autres natures, qui ne résultent pas toujours d’un processus d’observation. Comprendre ce matériau « data », c’est en explorer les principales dimensions, en s’appuyant sur le triplet <concept, domaine, valeur>.

    Toute donnée se caractérise par un vaste faisceau de conventions (sémantique, nomenclatures, formats, etc.), et par l’infrastructure de connaissances dans laquelle elle s’inscrit, impliquant des choix qui n’ont rien de neutre. Une donnée se révèle aussi dépendante de l’environnement qui lui a donné naissance, et des processus productifs qui l’utilisent. On constate alors que les données ne sont pas pures et parfaites, ne vont pas de soi : paradoxalement, les données ne sont pas données.
    Pour les besoins de la statistique publique, utiliser efficacement une telle matière requiert de démêler un entrelacs de conventions, et de construire une sorte d’appareil d’observation a posteriori , rigoureux sur les temporalités, et tenant compte de l’écosystème dans lequel la donnée externe s’inscrit.

    Sommaire
    Les données en statistique
    La donnée : tentative de caractérisation
    Encadré 1. Quelques clés sur la notion d’information
    Vers une définition en trois dimensions...
    ... le concept associé...
    ... le domaine...
    ... la valeur
    La donnée, les données...
    ... dans des bases, entrepôts, lacs, flux
    Environnement de la donnée
    Le statisticien face aux données externes
    En guise de conclusion