LANGUES • Google bute sur l’arabe

/google-bute-sur-l-arabe

  • #LANGUES
    #Google bute sur l’#arabe
    http://www.courrierinternational.com/article/2014/09/12/google-bute-sur-l-arabe

    Or l’arabe n’est pas seulement une langue difficile à cause de son vocabulaire pléthorique, il a en plus la particularité qu’il faut mentalement ajouter les voyelles courtes pour comprendre une phrase [sauf exception, l’arabe s’écrit en effet sans voyelles courtes]. A cela s’ajoutent deux autres facteurs. Le premier est le faible volume de textes arabes sur Internet, avec seulement 3 % du contenu total de la Toile au niveau mondial, toutes langues confondues.

    De plus, il ne s’agit pas de textes dûment établis – études, rapports officiels, textes journalistiques – mais d’une foule de textes disparates, écrits en divers #dialectes sur d’innombrables forums et blogs bourrés de fautes, de tournures bancales et de barbarismes. Ce qui ne facilite pas la tâche des #linguistes, qui ne peuvent pas s’en servir pour améliorer les performances de la traduction électronique comme ils le font pour les autres langues. Le seconde facteur se situe au niveau des utilisateurs. En effet, Google permet aux utilisateurs de noter les traductions, de signaler des contresens ou de proposer des améliorations.

    Or rares sont ceux qui le font. Pire, beaucoup “sabotent” en s’amusant à suggérer des traductions fantaisistes. D’autres participent intensément, mais dans le but de mettre en avant leur propre dialecte, avec des expressions qui peuvent être incompréhensibles pour les autres, fussent-ils arabophones. Google ne fait en effet aucune distinction entre un internaute libanais et un internaute saoudien, puisqu’il n’offre pas de services distincts pour l’#arabe_littéral et les différents dialectes.