Marrant !
Et quel est le R2 de la droite de tendance des R2 ? :-D
The average number of P values per paper has been steadily rising, they found.
Euh, là, ça aurait plutôt tendance à plafonner depuis une vingtaine d’années.
The average R2 should be increasing, he says, because more variables are being included in ecological models, which ought to make them more accurate.
Ben, si on augmente le nombre de variables explicatives, le R2 augmente, mais la significativité diminue (diminution du nombre de degrés de liberté du terme d’ajustement)
Sinon, il manque l’historique des tailles d’échantillon. Il y a de grandes chances que celles-ci augmentent. Du coup, les valeurs des R2 peuvent baisser sans affecter leur significativité (les p-values). Idem pour le nombre de variables explicatives.
Bref, on retombe sur le dilemme ultra-classique #biais-variance : augmenter la qualité de l’ajustement (le R2) finit par se faire au détriment de la valeur prédictive (F, p-value et donc, en définitive, variance du terme « d’erreur »).
Note :
Full disclosure : la valeur du F (et donc, la probabilité associée au test de significativité) est reliée directement à R2, n (taille d’échantillon) et k (nb de variables explicatives).
F = (R2/k)/((1-R2)/(n-k-1))