*La peste graphique* ❝Le camembert (ou pie_chart, comme disent les anglo-saxons) est partout.…

#message529879

  • Est-ce que quelqu’un.e connaît une bonne ressource pour comparer les avantages des différents types de graphiques (camembert, barres de pourcentages, etc) selon ce que l’on cherche à représenter ? J’ai pas besoin de quelque chose de très poussé, je voudrais en rester aux graphiques proposés par libreoffice par exemple. Je suis frustré du peu d’information que j’ai pu trouver, pourtant ça m’a l’air quand même assez important. merci :)

    (Edit : des réponses dans les commentaires)

    • Que veux tu dire par « plus fin » ?

      Tu trouveras facilement des variantes du graphique ci-dessus avec comme point d’entrée la « nature » de ce que tu veux faire : distribution, répartition/composition, évolution, comparaison,… éléments pas toujours clairement définis d’ailleurs. Il manque presque toujours, comme ci-dessus d’ailleurs, la « nature » de la donnée traitée (ou de la façon dont on la traite) : variable qualitative, ordinale, quantitative discrète ou continue.

      Sur ce genre de sujet, il y a l’incontournable, que tu connais j’imagine, https://flowingdata.com déjà bien présent ici avec plusieurs aficionado.a.s mais je ne crois pas qu’il y ait un schéma synthétique d’entrée dans le graphique.

    • En fait je trouve le schéma du pdf bien fait, mais je m’y suis pris dans l’autre sens avec mes élèves. Je leur ai posé une petite question sur les qualités/défauts de trois graphiques concernant le nombre de personnes employées dans différents secteurs, par sexe. Le graphique de base était des barres, et j’ai posé la question sur les variantes offertes par libreoffice (empilé, et pourcentage empilé). Du coup c’était plus pour leur montrer que sur un type de graphique (ici barre, par opposition aux autres types), une petite variation changeait ce qui pouvait être déduit du graphique. J’imagine que c’est ce que j’entends par finesse/granularité. Je crois que j’ai envie de passer par là avant d’aborder les choses dans le bon ordre, celui du pdf (qu’est-ce que je veux représenter -> quel diagramme je choisis)

    • Ah, ok !
      Là, ça devient très précis. C’est le premier exercice pratique que je fais quand j’aborde les problèmes de représentation graphique (mais, j’utilise l’outil de mes clients, un tableur célèbre…) : représentation d’un tableau de contingence. C’est un excellent moyen d’aborder pratiquement la sémiologie graphique. Mais je ne crois pas avoir trouvé de formalisation de l’approche et je trouve que c’est plus efficace en interactif avec les participants : ce sont leurs productions.

      En vrac (ou presque) :
      – barres juxtaposées : de très loin le plus mauvais (et pourtant pas le moins fréquent), on ne voit quasiment rien,
      – barres empilées : mieux, mais si les effectifs du total des barres sont trop différents, on ne peut pas juger des répartitions,
      – barres empilées en pourcentage : justement pour faire apparaître les distributions (conditionnelles ou profils)

      Du coup, toujours tester en intervertissant le rôle des lignes et des colonnes de la table (intervertir profils ligne et profils colonne, pour les 3 graphiques précédents)

      Réfléchir à l’ordre des modalités quand il n’y en a pas de « naturel » (comme pour les secteurs économiques) et donc ne pas hésiter à réordonner les barres, p. ex. par valeur croissante du taux de féminisation des secteurs…

      Tester les graphiques « exotiques », au moins pour en connaître l’existence :
      – anneaux ("camemberts empilés", en général illisibles, mais rigolos et bizarrement sur Excel, ils intervertissent les rôles des lignes et des colonnes)
      – bulles (nuage de points avec pondération du point par l’effectif), en général au prix d’un recodage, puisqu’il nécessite des abscisses et ordonnées numériques et d’un remaniement complet du tableau (col. des X, des Y et des effectifs)
      – surface 3D qui suppose qu’il y ait un ordre sur les X et les Y et surtout qu’on utilise un jeu de couleurs adapté, le standard étant parfaitement catastrophique. D’expérience toujours jugée incompréhensible et pourtant, la plupart des gens savent interpréter les informations d’altitude sur une carte… et sous le nom de heatmap elles sont à la mode
      – et, plus récemment, j’ajouterais le treemap (qui vient de débarquer sur la version 2016 du tableur, sous la pression de gg:spreadsheet qui l’offre depuis déjà un ou deux ans), là aussi, ça nécessite un reformatage important du tableau

      Enfin, puisque il y a la variable sexe, mobiliser la culture graphique existante est toujours intéressant et rappeler la forme « pyramide des âges », parfaitement réalisable sur n’importe quel tableur en utilisant des effectifs négatifs (je te laisse choisir le sexe ;-)

      Et puis, les barres (empilées) doivent-elles être jointives ? occasion de réfléchir au couple discret/continu, de se demander à quel moment commencent les aires empilées, etc.

    • Merci pour le développement.

      Pour les graphiques en barre, j’en suis arrivé aux mêmes conclusions que toi intuitivement. Par contre j’ai posé la question aux élèves sans leur expliquer avant, et ça a été très difficile pour eux de trouver les sens différents des graphiques (niveau BTS). Effectivement les barres juxtaposées sont un compromis (plutôt mauvais) entre répartition et quantité, et c’est le graphique qui est proposé de base dans libreoffice :(

      Pour les graphiques exotiques se serait bien oui, mais faut déjà que j’en apprenne un peu plus moi-même :) Pour la pyramide des âges, je ne sais pas si c’est indiqué dans mon exemple car les données sont les catégories socio-pro et le sexe. Il n’y a pas d’âge et j’ai l’impression que l’axe de la pyramide marque une continuité (âge, date, ...) que je n’ai pas.

      Dans l’idéal j’aimerais faire un cours d’autodéfense intellectuelle (et même d’"offensive intellectuelle" d’ailleurs) sur les représentations graphiques de données mais malheureusement le temps me manque pour cette année.