Inferring chart type from autocorrelation and other evils

Fil 24/04/2019

Inferring chart type from autocorrelation and other evils
▻https://observablehq.com/@tophtucker/inferring-chart-type-from-autocorrelation-and-other-evils

Un #essai de #statistiques qui devrait ravir @simplicissimus

Fil

Simplicissimus @simplicissimus 25/04/2019

#merci
Rigolo, mais pas du tout convaincu… Pour moi, surtout pour des séries chronologiques dont il traite ici, le choix entre nuage de points (en gros « ligne », mais avec un « vrai » axe des x, pas un axe d’étiquettes) et diagramme en bâtons est affaire de la nature de la variable représentée et de sa relation au temps. Au moins théoriquement, la pratique et l’usage s’éloignant fréquemment de la « théorie ». En gros, la différence entre données de type « stock » ou données de type « flux ».
La valeur d’une variable de « stock » est associée à un instant donné. Donc un point dans le plan (t, y). Pour les instants pour lesquels on ne dispose pas de valeurs, et sous réserve de la continuité de la fonction y = f(t), il est concevable d’interpoler une valeur alors, il faut relier les points entre eux par une ligne (pas nécessairement un segment de droite d’ailleurs).
Un « flux » n’a de sens que rapporté à un intervalle de temps. Dans cet intervalle, sauf à connaître les valeurs pour des sous-intervalles moins larges, on supposera pour la représentation graphique que le flux est constant. On représentera donc celui-ci par un segment horizontal allant du début à la fin de l’intervalle, ce qui se fait aisément avec un diagramme en bâtons. Du moins, si les intervalles de temps sont tous de même amplitude ; dans le cas contraire, il faut procéder comme pour les histogrammes à intervalles inégaux (et ça devient compliqué pour le représenter avec les logiciels usuels).
Pas convaincu ? Il faut se poser la question de ce que deviennent les représentations des deux types de variable lorsque l’intervalle de mesure n’est pas uniforme.
Et puis, il y a la pratique…
Un billet pour VC ? avec exemples, graphiques et variantes ?

Simplicissimus @simplicissimus
freakonometrics @freakonometrics 25/04/2019

perso, c’est dommage de ne rien voir si les racines unites (correlation ~1), les marches aleatoires... il decouvre surtout la correlation (plus que la fonction d’autocorrelation), mais j’ai bien aime les references a la fin

freakonometrics @freakonometrics
Fil @fil 25/04/2019

réponses de @tophtucker :
merci! très réfléchi. i totally agree about stock & flow; the original context this problem came up in was one where we had no metadata for the series
…
thanks! i’d thought briefly about stationarity but really don’t know where to begin with it. random walks is an interesting idea but idk where you’d want to go with it! a random walk would always have a very high autocorr(1) right? or are you thinking about longer lags? or...

Fil @fil
Simplicissimus @simplicissimus 25/04/2019

merci
ça circule vite. it flows quickly ;-)

Simplicissimus @simplicissimus

Écrire un commentaire