Le gouvernement britannique lance un logiciel pour détecter les vidéos djihadistes

/le-gouvernement-britannique-lance-un-lo

  • Le gouvernement britannique lance un logiciel pour détecter les vidéos djihadistes
    http://www.lemonde.fr/pixels/article/2018/02/14/le-gouvernement-britannique-lance-un-logiciel-pour-detecter-les-videos-djiha

    Pour lutter contre la diffusion en ligne de vidéos de propagande de l’organisation djihadiste Etat islamique (EI), le gouvernement britannique a financé le développement d’un algorithme censé les détecter, a annoncé mardi 13 février le ministère de l’intérieur dans un communiqué. Objectif : le mettre à disposition de sites qui n’ont pas les moyens de créer leurs propres outils de détection.

    Le ministère ne précise toutefois pas quelles conditions sont nécessaires pour accéder à cet outil. « Cette technologie sera mise à disposition gratuitement à toute plateforme qui en aura besoin », annonce de son côté, sans donner plus de détails, l’entreprise ASI Data Science.

    C’est elle qui a été missionnée pour mettre au point ce programme, avec 600 000 livres (674 000 euros) de fonds publics. Cette petite entreprise londonienne vante les prouesses de son programme, capable, selon elle, de détecter 94 % des contenus de propagande de l’EI. Elle estime le taux d’erreur, c’est-à-dire le nombre de vidéos identifiées à tort comme étant problématiques, à environ 0,005 %.

    Pour fonctionner, le programme d’intelligence artificielle a analysé un millier de vidéos de propagande de l’EI afin d’apprendre à les reconnaître. Il se base notamment sur plusieurs critères pour les détecter. Certains renvoient à des éléments audio ou visuels, comme des logos ou des symboles utilisés par l’EI. D’autres concernent, eux, le contenu des métadonnées, c’est-à-dire les informations liées à la vidéo. Par exemple : de quel pays a été mise en ligne une vidéo.

    • Le communiqué FB de l’entreprise ASI Data Science ne mentionne pas la taille de l’échantillon d’apprentissage, mais celle de celui de validation.

      ASI Data Science - Publications
      https://www.facebook.com/asidatascience/posts/2081754788711095

      Our model uses a wide range of cutting edge machine learning techniques to look for subtle signals inside videos that can distinguish Daesh propaganda from all the other videos on the internet. We have tested it against around 100k videos on the live web. It was able to capture 94% of Daesh propaganda while flagging incorrect content only 0.005% of the time.

      (au passage, la rédaction ci-dessus suppose qu’il a fallu vérifier 100 000 vidéos… ça fait beaucoup !

      on aurait 6% de faux négatifs (soit 6000, tout de même, vidéos de propagande non détectées)
      et 5 faux positifs (vidéos innocentes marquées comme propagandistes, sur 100 000)