tbn

récoltes et semailles

  • Levan : l’encyclopédie en ligne qui sait « tout sur tout »
    Checklist du Monde, 16 juin 2014

    L’encyclopédie participative #Wikipedia agrège énormément d’informations sur beaucoup de sujets.
    https://en.wikipedia.org/wiki/Wikipedia:Statistics

    Mais elle ne peut se développer qu’à un rythme « humain » : seuls les internautes peuvent ajouter de nouveaux articles. C’est en voulant dépasser cela qu’une équipe de chercheurs de l’Institut Allen pour l’intelligence artificielle et de l’université de Washington a commencé à développer #Levan, un programme qui se nourrit tout seul de l’immense quantité d’informations disponibles sur Internet.
    http://levan.cs.washington.edu

    https://www.youtube.com/watch?v=kg4As_JLR84

    La nouveauté est que le site n’est ni supervisé ni non supervisé : il est supervisé par le Web. Il fonctionne en parcourant notamment l’outil linguistique #Ngram viewer de Google, adossé à Google Livres, pour trouver des termes associés à un concept. Levan cherche ensuite les visuels associés sur Google Images, Flickr et Bing. L’#algorithme associe des visuels car ils ont l’avantage de faire comprendre plus facilement un concept : l’illustration du mot « cheval » est plus efficace que sa définition pour le comprendre. Ce que la plateforme revendique, c’est de savoir « tout sur tout ». Par exemple, le terme « courir » est associé à 501 sous-catégories et 705 320 images : il s’agit de toutes les images et de tous les termes qui sont associés au mot « courir » sur le Web. Actuellement, Levan compte 161 entrées, pas de quoi affoler Wikipedia et ses 31 millions d’articles en
    285 langues, mais ce chiffre devrait augmenter rapidement. Par ailleurs, alors que Wikipedia est une encyclopédie « classique », bien qu’elle n’existe qu’en ligne, Levan s’apparente davantage à un dictionnaire des savoirs du Web. Les internautes sont invités à soumettre de nouveaux termes, qui apparaîtront en moyenne vingt-quatre heures après avoir été saisis sur la plateforme, une fois que l’algorithme aura fini son long calcul.