bce_106_6

Académie ESJ, et cacadémie esj

  • [NSA] Trouver votre voix, par Ava Kofman Traduction Les Crises - The Intercept - Ava Kofman - le 19 janvier 2018
    https://www.les-crises.fr/nsa-trouver-votre-voix-par-ava-kofman

    Oubliez Siri et Alexa – Quand on parle d’identification vocale, la NSA règne en « maître absolu ».

    . . . . . . . . . .
    Les nouveaux outils vocaux
    Tandis que les américains sont au courant depuis 2013 de la collecte massive de données téléphoniques nationales et étrangères par la NSA, le processus par lequel ces données brutes sont converties en informations significatives est resté largement confidentiel. En 2015, The Intercept rapportait que la NSA avait mis au point une série de « technologies du langage humain » pour donner un sens à l’extraordinaire quantité des données audio recueillies par le gouvernement. En développant des programmes pour traduire automatiquement la parole en texte – ce que les analystes appelaient « Google for voice » – l’agence pouvait utiliser des mots-clés et des « sélecteurs » pour rechercher, lire et indexer des enregistrements qui auraient autrement nécessité un nombre infini des personnes pour les écouter.

    La reconnaissance des locuteurs est apparue en même temps que ces logiciels synthétiseurs de la parole au texte comme une technique additionnelle pour aider les analystes à trier les innombrables heures d’interceptions en provenance des zones de guerre. Une grande partie de sa croissance et de sa fiabilité est due aux investissements de la NSA et du Département de la Défense. Avant l’ère numérique, la reconnaissance des locuteurs était principalement pratiquée en science médico-légale. Pendant la Seconde Guerre mondiale, des analystes humains ont comparé les empreintes visuelles des fréquences vocales à la radio. Selon Harry Hollien, l’auteur de Forensic Voice Identification, ces machines à « parole visible », connues sous le nom de spectrogrammes, ont même été utilisées pour réfuter une rumeur selon laquelle Adolf Hitler aurait été assassiné et remplacé par un double.

    « Les empreintes vocales étaient quelque chose que l’on pouvait examiner », explique James Wayman, un éminent spécialiste de la reconnaissance vocale qui préside les efforts fédéraux visant à recommander des standards pour la reconnaissance médico-légale des locuteurs. Il a souligné que le terme « empreinte vocale », bien qu’il soit largement utilisé par les fournisseurs commerciaux, peut être trompeur, car il implique que l’information saisie est physique plutôt que comportementale. « Ce que vous avez maintenant, c’est une équation intégrée dans un logiciel qui crache des chiffres », a-t-il dit.
    Ces équations ont évolué de simples moyennes à des modèles algorithmiques dynamiques. Depuis 1996, la NSA a financé le National Institute of Standards and Technology Speech Group pour développer et tester ce qu’elle appelle “l’approche algorithmique la plus dominante et la plus prometteuse face aux problèmes de reconnaissance des locuteurs”. Parmi les participants qui testent leurs systèmes avec le NIST figurent des entreprises de pointe en biométrie et des universitaires, dont certains sont financés par la NSA et la Defense Advanced Research Projects Agency, ou DARPA.

    Le silence de la NSA autour de son programme de reconnaissance des locuteurs rend difficile de déterminer ses pouvoirs actuels. Mais étant donné les liens étroits qui existent entre la recherche universitaire financée par la NSA et les entreprises privées, une bonne approximation des capacités des NSA peut être tirée de ce que font d’autres pays – et quels fournisseurs les vendent.
    Par exemple, Nuance, l’un des leaders du secteur, fait de la publicité auprès des gouvernements, des forces armées et des services de renseignement « un système biométrique vocal national capable d’identifier et de segmenter rapidement et avec précision les individus au sein de systèmes comprenant des millions d’empreintes vocales ». En 2014, l’Associated Press a rapporté que la technologie de Nuance avait été utilisée par la plus grande société turque de téléphonie mobile pour collecter des données vocales auprès d’environ 10 millions de clients.

    En octobre, Human Rights Watch a signalé que le gouvernement chinois avait constitué une base de données nationale d’empreintes vocales afin de pouvoir identifier automatiquement les personnes qui parlent au téléphone. Le gouvernement vise à relier la biométrie vocale de dizaines de milliers de personnes à leur numéro d’identité, leur origine ethnique et leur adresse. Selon HRW, le distributeur de logiciels vocaux chinois a même breveté un logiciel permettant de localiser les fichiers audio pour « surveiller l’opinion publique ».
    En novembre, un projet international majeur de reconnaissance des locuteurs financé par l’Union européenne a passé son test final, selon un communiqué de presse d’Interpol. Plus de 100 analystes du renseignement, chercheurs et agents des services de police de plus de 50 pays – dont Interpol, le Metropolitan Police Service du Royaume-Uni et la Polícia Judiciária portugaise – ont assisté à la présentation, au cours de laquelle les chercheurs ont prouvé que leur programme pouvait identifier des « locuteurs inconnus parlant dans différentes langues… par le biais de médias sociaux ou de moyens audio légalement interceptés ».

    Les documents de la NSA examinés par The Intercept décrivent les contours d’un système aussi extensif – un système qui, dans les années qui ont suivi le 11 septembre, a permis aux « analystes linguistiques de passer au crible des centaines d’heures de montages vocaux en quelques secondes et de sélectionner des éléments d’intérêt potentiel en fonction de mots clés ou de la reconnaissance vocale des locuteurs. »

    . . . . . . . . . .
    Article original : https://theintercept.com/2018/01/19/voice-recognition-technology-nsa
    #NSA #reconnaissance-audio #surveillance #internet #vie_privée #espionnage #silicon_army #privacy #usa #contrôle #sécurité #censure #écoutes #etats-unis #voix