Initialement, c’est exprès (puisque techniquement, on détecte aussi séparément la langue de chaque citation et la langue du commentaire de l’auteur) :
– avant tout parce que ce n’est pas conçu pour être un outil de conversation, mais de validation ; la traduction automatique étant ce qu’elle est, l’idée n’est pas de permettre de discuter entre des gens qui ne parlent pas la même langue (gros risques de contresens), mais de valider le sens général des citations ;
– le second aspect est que j’ai considéré que les citations étaient généralement très cohérentes dans leur forme, puisqu’il s’agit d’extraits d’articles. Donc : phrases construites et complètes, pas de mélange des langues, idées clairement explicitées (c’est pour ça qu’on cite justement tel passage)… c’est la forme la plus favorable pour une traduction automatique. Alors que dans le message d’origine, c’est nettement plus farfelu : phrases incomplètes, mélange des langues (notamment : il y a généralement le titre de l’article cité, qui est donc dans la langue de la citation), listes de hashtags, tournures humoristiques (second degré très usuel), raccourcis provocateurs… toutes choses qui donnent des traductions automatiques très hasardeuses.