Affaire Grégory : la stylométrie permettra-t-elle enfin d’identifier le corbeau ?
▻https://theconversation.com/affaire-gregory-la-stylometrie-permettra-t-elle-enfin-didentifier-l
L’ambition de la société suisse OrphAnalytics, qui espère retrouver le corbeau de l’affaire Grégory avec pour unique preuve cinq courtes lettres, rejoint ces dernières recherches sur les réseaux sociaux, dont les publications ne dépassent parfois pas 140 caractères. Cette ambition doit nous interpeller pour deux raisons. D’une part, avec l’abaissement du matériel écrit nécessaire, nos publications en ligne nous transforment tous en potentiels cas d’étude pour des recherches d’attribution. Les comptes Twitter anonymes relayant des avis de personnes tenues au devoir de réserve, ou ne souhaitant pas mêler vie professionnelle et convictions personnelles sont les premiers menacés, mais nous sommes tous concernés.
Le raccourcissement des textes analysés va cependant de pair avec une diminution de la fiabilité de la stylométrie. Une récente étude avec des textes du XIXe siècle a ainsi déterminé que 5 000 mots était un prérequis pour garantir la solidité des résultats. Mais si le nombre de mots à disposition n’est pas suffisant, la machine continue quand même de renvoyer un résultat, qu’il est tentant d’utiliser. À partir de quel taux de confiance le résultat d’une analyse stylométrique devient-il fiable ? Et, dans le cas d’un procès ou de la surveillance de masse, fiable est-il réellement suffisant ?
(...) quid d’un gouvernement oppressif qui chercherait à identifier des opposants politiques pensant s’exprimer anonymement sur la toile ?