L’interprétation des graphiques produits par Ngram Viewer

/469

  • L’interprétation des graphiques produits par Ngram Viewer | Déjà vu
    http://culturevisuelle.org/dejavu/469

    La mise en ligne de Ngram Viewer a provoqué une profusion d’exemples postés sur différents sites ou blogs, très souvent sans aucun commentaires. Ils sont proposés sur un mode presque ludique, présentés sous un format antagonique (X vs Y), et comme si les courbes tracées suffisaient à mettre au jour de réels phénomènes linguistiques ou culturels. (...)
    La facilité d’usage ne masque pas cependant le fait que l’#interprétation de la plupart de ces graphiques est totalement impossible sans plonger dans l’analyse des documents numérisés sur Google Books. Or cette tâche est non seulement d’une ampleur colossale pour le moindre exemple de visualisation mais elle est tout simplement irréalisable en ligne puisque les documents sous copyright ne sont pas consultables. (...)
    Ngram Viewer doit en fait être considéré comme un outil heuristique qui permet plus de poser de nouvelles questions que d’apporter des réponses.

    Prodiges et vertiges de la lexicométrie | Socio-informatique et argumentation
    http://socioargu.hypotheses.org/1963

    Le problème majeur de l’outillage proposé est l’absence d’idée claire sur le corpus global, que redouble l’absence des valeurs absolues obtenues pour les résultats. Si l’option de lissage intégrée dans l’outil rend manifeste que les développeurs ont entrevu le problème de mesure qu’ils ont en quelque sorte créé de toutes pièces, compte tenu de la masse explorée, la correction ne fait que lisser les courbes et souligner les saillances, sans changer les tendances de fond. En fait une des contraintes vient du fait que, pour éviter tout problème de copyright, les chercheurs ont dû dépouiller les mots de leur contexte.

    Bref, ce genre d’outil est à utiliser avec précaution car il suppose de mobiliser en toile de fond une culture encyclopédique importante et de disposer d’un autre espace de calcul servant de contrepoint interprétatif

    #ngram_viewer #google #recherche