via Antonio A. Casili sur FB, qui l’accompagne de ces utiles compléments :
Ce n’est pas vraiment une surprise : d’après cette enquête du New York Times, derrière le système de reconnaissance faciale Face++ du chinois Megvii Technology, des micro-tâcherons qui, avec leur travail du clic, entraînent des IA depuis une ancienne usine de ciment. Là où ça redevient intéressant (et où l’enquête du New York Times s’interrompt) c’est quand on va fouiller sur les sites de sous-traitance de la tech chinoise et internationale, avec un petit coup de pouce de collègues sinophones que ma discrétion m’interdit de nommer ici. On y découvre l’étendue du portefeuille clients de la Nangong Yunzhi Data Processing, la petite usine à clics à laquelle le New York Times fait la part belle.
Tout d’abord, ses micro-travailleur•ses font pas mal de classification de produits pour entraîner les algorithmes de recommandation des plateformes d’e-commerce, comme Jingdong & Taobao. Ils s’adonnent aussi à l’annotation audio pour l’entreprise spécialisée en traduction automatique SpeechOcean (contrôlée de la Beijing Haitian Ruisheng Science Technology Ltd., qui a son tour marchande des corpus annotés pour traduction et analyse lexicale sur sa propre plateforme, King Line Data Center).
Après quoi, on sort les gros calibres, avec de la reconnaissance d’images pour Baidu Total View, concurrent chinois de Google Street View (pour la petite histoire, Google Street View semble recruter beaucoup moins de micro-travailleurs parce que... ses images sont largement reconnues par ses utilisateur•rices mêmes, digital laborers « gratuit•es », à l’aide des reCAPTCHA visuels).
L’un des clients les plus inquiétants est Tencent, pour lequel notre usine à clics fait de la retranscription speech-to-text. Le géant chinois de la messagerie possède, entre autres, la communauté QQ et l’application WeChat avec son important trafic de voix-sur-IP et sa fonctionnalité de retranscription « automatique » de messages vocaux. Comme quoi, quand vous parlez dans ce machin, il y a toujours des chances que quelqu’un vous écoute pour retranscrire en temps quasi-réel ou pour corriger des transcriptions défectueuses de l’appli même. Bonjour, la privacy.
Et à propos de privacy, notre Nangong Yunzhi Data Processing compte parmi ses projets la labellisation et la prépration des pièces d’identités indonésiennes — les tristement célèbres e-KTP qui contiennent une quantité pharamineuse de données biométriques et concernent plus de 100 millions de citoyen•nes.
Enfin, le must : du véhicule autonome ! Plus précisément, de l’entraînement du système de reconnaissance faciale embarqué des véhicules NIO—nécessaire pour éviter vols, fraudes à l’assurance, ou vérifier que le conducteur ne soit pas distrait. Et oui, le « conducteur ». Parce qu’évidemment une voiture « driverless » doit toujours être conduit par quelqu’un.
A suivre...