Articles repérés par Hervé Le Crosnier

Je prend ici des notes sur mes lectures. Les citations proviennent des articles cités.

  • Gaîté Lyrique | Données fantômes : ce qui n’est pas compté et qui compte
    https://gaite-lyrique.net/article/donnees-fantomes-ce-qui-nest-pas-compte-et-qui-compte

    Certaines données sont collectées, d’autres sont manquantes. Qu’est-ce qui préside à ce choix ? L’artiste et chercheuse nigérienne-américaine Mimi Onuoha interroge les façons dont les individus sont catégorisés. Elle s’attache à mettre en évidence que la collecte, l’enregistrement et l’archivage des données sont liés aux questions de contrôle et de pouvoir.

    Le fait qu’un groupe de fans inconditionnels de la comédie musicale Hamilton ait créé un document partagé recensant l’intégralité des paroles avant même que la bande originale du spectacle ne soit commercialisée méritait par exemple de figurer dans cette liste. Autre exemple : en 2016, un utilisateur de Reddit a mis à disposition les métadonnées de toutes les histoires publiées à ce jour sur fanfiction.net, un site connu pour ses fictions écrites par des fans.

    Et ainsi de suite : le nombre de ballons de football produit quotidiennement par l’usine Wilson Sporting Goods de la ville d’Ada, dans l’Iowa (soit 4000 en 2008) ; le nombre de hot-dogs avalés par les Américains à chaque fête de l’Independance Day (soit 150 millions selon les dernières estimations) ; l’emplacement de toutes les toilettes publiques d’Australie (plus de 17000)."
    Qu’est-ce qu’une donnée ?

    "Mitchell Whitelaw, universitaire australien, définit les données comme « des mesures extraites du flux de la réalité ». En général, lorsqu’on pense à de grands ensembles de données, il s’agit de choses importantes : le recensement d’une population, les données de l’Organisation mondiale de la santé, et toutes les informations amassées par les grandes entreprises comme Google, Amazon ou Facebook.

    De ce point de vue, cette définition est admirablement concise et efficace. L’emploi du verbe « extraire » désigne avec pertinence les données comme des matières premières. De la même manière que Shosana Zuboff parle de « capitalisme de surveillance » en expliquant que le capitalisme actuel monétise des données recueillies par le biais d’une surveillance généralisée, la formulation de Mitchell Whitelaw évoque la conception des entreprises : les données sont des ressources à exploiter. Dans une société capitaliste, enregistrer des données ne peut être que bon pour les affaires. Le monde est ainsi enregistré, classifié, rendu déchiffrable, rentable.

    Plus loin dans le livre, les auteurs soulèvent un point déterminant de cette classification du monde. « Aucun système de classification n’est capable d’organiser la réalité pour tout le monde », préviennent-ils. « Exemple : le rouge, l’orange et le vert des feux tricolores ne fonctionnent pas pour les personnes non voyantes, elles ont besoin d’un signal sonore. Si l’on considère ces schémas de classification comme le moyen d’organiser le passé, il est facile d’oublier ceux qui en ont été exclus. »

    Quant à ma liste, son rapport direct avec ces concepts d’extraction de ressources et de surveillance omniprésente n’est pas forcément évident. Elle regroupe des ensembles de données qui sont peut-être assez inédits, mais ils sont le summum de la quantification, ce sont des faits extraits de pans insolites de la réalité. Une définition plus simple me vient à l’esprit.

    Données : choses que nous mesurons et qui comptent à nos yeux.

    C’est ce qui fait toute la beauté de cette étrange liste. Si la définition de Mitchell Whitelaw décrit le monde comme n’étant qu’une immense source de matières premières à extraire pour remplir les cellules bien alignées d’un fichier Excel, la mienne affirme l’inverse : tous les ensembles de données sont créés par des êtres humains dans un but bien précis.❞

    Missing Datasets : les informations manquantes

    "Voici quelques exemples de données que nous ignorons :

    Le nombre de personnes vivant dans des sous-locations illégales à New York,
    La traçabilité des armes vendues aux États-Unis et les informations sur leurs propriétaires,
    Le nombre de gens expulsés des États-Unis selon l’État où ils vivaient,
    Le nombre de Rohingyas en Birmanie.

    J’emploie le terme « Missing Datasets », pour désigner ces informations manquantes, angles morts d’un monde qui semble aujourd’hui criblé de données. Autant de fantômes qui font penser à la liste scotchée sur un coin de mon bureau. Ces données représentent tout autant la réalité de notre monde, summum d’une quantification qui a été mise de côté. Nous ne mesurons que les choses qui nous intéressent suffisamment. Les données manquantes ont aussi de la valeur, mais elles ne peuvent pas être mesurées.

    La complexité et le désordre de ces données sont passionnants, car elles trahissent un certain type de pouvoir. Une absence toujours remarquée laisse entrevoir le spectre d’un autre monde, où les priorités seraient différentes. Aucune donnée n’existe sur les violences policières faites aux Amérindiens, mais que se passerait-il si c’était le cas ?

    Ces données manquantes n’apportent aucune réponse, mais elles font office de rappel cinglant : nous sommes responsables de la manière dont nous cataloguons le monde. En choisissant les données à prendre en compte et en leur allouant une crédibilité, nous déterminons les limites de notre monde. Si tel est le cas, alors nous sommes aussi capables de changer cet état de fait, et à chaque instant, de changer notre monde."

    #Données #Données_manquantes #Classification

    merci @fil, c’est passionnant