• How Cheap Labor Drives China’s A.I. Ambitions - The New York Times
    https://www.nytimes.com/2018/11/25/business/china-artificial-intelligence-labeling.html


    Workers at the headquarters of Ruijin Technology Company in Jiaxian, in central China’s Henan Province. They identify objects in images to help artificial intelligence make sense of the world.
    CreditCreditYan Cong for The New York Times

    Some of the most critical work in advancing China’s technology goals takes place in a former cement factory in the middle of the country’s heartland, far from the aspiring Silicon Valleys of Beijing and Shenzhen. An idled concrete mixer still stands in the middle of the courtyard. Boxes of melamine dinnerware are stacked in a warehouse next door.

    Inside, Hou Xiameng runs a company that helps artificial intelligence make sense of the world. Two dozen young people go through photos and videos, labeling just about everything they see. That’s a car. That’s a traffic light. That’s bread, that’s milk, that’s chocolate. That’s what it looks like when a person walks.

    I used to think the machines are geniuses,” Ms. Hou, 24, said. “Now I know we’re the reason for their genius.

    • via Antonio A. Casili sur FB, qui l’accompagne de ces utiles compléments :

      Ce n’est pas vraiment une surprise : d’après cette enquête du New York Times, derrière le système de reconnaissance faciale Face++ du chinois Megvii Technology, des micro-tâcherons qui, avec leur travail du clic, entraînent des IA depuis une ancienne usine de ciment. Là où ça redevient intéressant (et où l’enquête du New York Times s’interrompt) c’est quand on va fouiller sur les sites de sous-traitance de la tech chinoise et internationale, avec un petit coup de pouce de collègues sinophones que ma discrétion m’interdit de nommer ici. On y découvre l’étendue du portefeuille clients de la Nangong Yunzhi Data Processing, la petite usine à clics à laquelle le New York Times fait la part belle.

      Tout d’abord, ses micro-travailleur•ses font pas mal de classification de produits pour entraîner les algorithmes de recommandation des plateformes d’e-commerce, comme Jingdong & Taobao. Ils s’adonnent aussi à l’annotation audio pour l’entreprise spécialisée en traduction automatique SpeechOcean (contrôlée de la Beijing Haitian Ruisheng Science Technology Ltd., qui a son tour marchande des corpus annotés pour traduction et analyse lexicale sur sa propre plateforme, King Line Data Center).

      Après quoi, on sort les gros calibres, avec de la reconnaissance d’images pour Baidu Total View, concurrent chinois de Google Street View (pour la petite histoire, Google Street View semble recruter beaucoup moins de micro-travailleurs parce que... ses images sont largement reconnues par ses utilisateur•rices mêmes, digital laborers « gratuit•es », à l’aide des reCAPTCHA visuels).

      L’un des clients les plus inquiétants est Tencent, pour lequel notre usine à clics fait de la retranscription speech-to-text. Le géant chinois de la messagerie possède, entre autres, la communauté QQ et l’application WeChat avec son important trafic de voix-sur-IP et sa fonctionnalité de retranscription « automatique » de messages vocaux. Comme quoi, quand vous parlez dans ce machin, il y a toujours des chances que quelqu’un vous écoute pour retranscrire en temps quasi-réel ou pour corriger des transcriptions défectueuses de l’appli même. Bonjour, la privacy.
      Et à propos de privacy, notre Nangong Yunzhi Data Processing compte parmi ses projets la labellisation et la prépration des pièces d’identités indonésiennes — les tristement célèbres e-KTP qui contiennent une quantité pharamineuse de données biométriques et concernent plus de 100 millions de citoyen•nes.

      Enfin, le must : du véhicule autonome ! Plus précisément, de l’entraînement du système de reconnaissance faciale embarqué des véhicules NIO—nécessaire pour éviter vols, fraudes à l’assurance, ou vérifier que le conducteur ne soit pas distrait. Et oui, le « conducteur ». Parce qu’évidemment une voiture « driverless » doit toujours être conduit par quelqu’un.

      A suivre...