• #merci

      Rigolo, mais pas du tout convaincu… Pour moi, surtout pour des séries chronologiques dont il traite ici, le choix entre nuage de points (en gros « ligne », mais avec un « vrai » axe des x, pas un axe d’étiquettes) et diagramme en bâtons est affaire de la nature de la variable représentée et de sa relation au temps. Au moins théoriquement, la pratique et l’usage s’éloignant fréquemment de la « théorie ». En gros, la différence entre données de type « stock » ou données de type « flux ».

      La valeur d’une variable de « stock » est associée à un instant donné. Donc un point dans le plan (t, y). Pour les instants pour lesquels on ne dispose pas de valeurs, et sous réserve de la continuité de la fonction y = f(t), il est concevable d’interpoler une valeur alors, il faut relier les points entre eux par une ligne (pas nécessairement un segment de droite d’ailleurs).

      Un « flux » n’a de sens que rapporté à un intervalle de temps. Dans cet intervalle, sauf à connaître les valeurs pour des sous-intervalles moins larges, on supposera pour la représentation graphique que le flux est constant. On représentera donc celui-ci par un segment horizontal allant du début à la fin de l’intervalle, ce qui se fait aisément avec un diagramme en bâtons. Du moins, si les intervalles de temps sont tous de même amplitude ; dans le cas contraire, il faut procéder comme pour les histogrammes à intervalles inégaux (et ça devient compliqué pour le représenter avec les logiciels usuels).

      Pas convaincu ? Il faut se poser la question de ce que deviennent les représentations des deux types de variable lorsque l’intervalle de mesure n’est pas uniforme.

      Et puis, il y a la pratique…

      Un billet pour VC ? avec exemples, graphiques et variantes ?

    • réponses de @tophtucker :

      merci! très réfléchi. i totally agree about stock & flow; the original context this problem came up in was one where we had no metadata for the series

      thanks! i’d thought briefly about stationarity but really don’t know where to begin with it. random walks is an interesting idea but idk where you’d want to go with it! a random walk would always have a very high autocorr(1) right? or are you thinking about longer lags? or...