ofa-/predictor : graph for réa and dc, with maybe réa as a predictor of dc

/predictor

  • Nouvelle livraison INSEE, données décès jusqu’au 28 décembre 2020.

    cette mise à jour dit +42k morts en décembre (métropole et outre-mer) ; en plus des 13.7k comptés à la précédente livraison (18 décembre), ça ferait au total dans les 56k morts en décembre 2020 ; pour métropole (hors outre-mer), en moyenne sur 2018 et 2019 on avait environ 53k morts en décembre ;

    a priori et à la louche, légère surmortalité en décembre (à confirmer), correspondant à l’aire sous la (fin de la) bosse bleue.

    mise à jour par rapport a la dernière livraison :

    diff -ru insee_dc.2020-12-18 insee_dc.2021-01-08 |\
         7 +2020;01
         4 +2020;02
         5 +2020;03
         3 +2020;04
         6 +2020;05
         4 +2020;06
        13 +2020;07
        18 +2020;08
        22 +2020;09
        98 +2020;10
       436 +2020;11
     42132 +2020;12

    précédent : https://seenthis.net/messages/892164

    • Le nombre de décès en 2020 est « nettement supérieur » à celui de l’année 2019
      https://www.lemonde.fr/les-decodeurs/article/2021/01/08/le-nombre-de-deces-en-2020-est-nettement-superieur-a-celui-de-l-annee-2019_6


      source Insee

      « C’est faux. Le nombre de décès en 2020 est nettement plus important que celui-ci que l’année précédente, corrige Sylvie Le Minez, cheffe du département des études démographiques et sociales à l’Insee. C’est la première année où l’on atteint un tel niveau de décès, sachant que l’on voit déjà la mortalité progresser d’environ 6 000 personnes chaque année en raison de l’arrivée des générations du baby-boom, beaucoup plus nombreuses que les autres, dans des âges où l’on meurt plus souvent. Mais la hausse de cette année est sans commune mesure. »

      Surmortalité importante au printemps et à l’automne
      Dans le détail, la surmortalité est notoire aux deux pics épidémiologiques. « En nombre de décès, les mois de mars et avril 2020 sont bien supérieurs aux années précédentes », continue Sylvie Le Minez, tandis que concernant la seconde vague « septembre est légèrement au-dessus, octobre encore plus, et c’est très net pour novembre, par rapport aux cinq dernières années ou à 2019. »

      Alors que la mortalité quotidienne, toutes causes confondues, en France est habituellement comprise entre 1 400 et 1 900 décès par jour, elle a dépassé la barre des 2 000 morts quotidiennes de manière quasi ininterrompue du 16 mars au 19 avril et très fréquemment du 21 octobre au 16 décembre 2020. L’écart le plus important a été enregistré le 1er avril, avec 2 811 morts contre 1 684 le même jour, en moyenne, sur les cinq précédentes années. Du reste, depuis le second pic, le 7 novembre, le nombre de morts baisse très lentement.

      « L’excédent de décès provient à la fois de décès en plus liés au Covid-19 directement ou indirectement, mais il y a aussi eu des décès en moins, engendrés par l’effet protecteur du confinement », nuance Mme Le Minez. On sait notamment que la criminalité et les accidents de la route ont connu une chute au printemps.

    • alors le nombre de décès « nettement » supérieur, ils pourraient sortir une calculatrice et donner un % ?

      j’ai fait à la louche suite à question d’un pote, je trouve +18% par rapport à une moyenne 2018-2019 (en prenant +120k morts sous les 2 bosses, et 1800 morts/j x 365 habituellement)

    • mon premier « à la louche » est largement faux, c’était basé sur du pifomètre de sur-mortalité pour chaque bosse, tiré de mémoire d’une estimation de 50k morts en plus de la moyenne pour la bosse du printemps, trouvé sur le graphique de B. Coulmont posté ici ( https://seenthis.net/messages/891914#message891970 ) précédemment ; sauf que, je m’a trompé, il dit 31k morts de plus au printemps...

    • J’ai repris les données du rapport INSEE pointées par @ericw :

      Je trouve les chiffres suivants :

      – 2018 : 604.6k
      – 2019 : 608.0k
      – 2020 : 659.9k

      soit, 606.3k en moyenne pour 2018-2019 (604.6+608)/2

      soit +53.6k d’écart pour 2020,
      donc +8.8% (53.6/606.3)

      good for u @fil ?

    • Du coup, c’est à se demander où sont passés les 60k morts coviiiiiiid de l’épisode 1 et ceux encore plus nombreux de l’épisode 2 ...

    • @olaf : pourquoi tu veux comparer 2020 à u e moyenne 2018-2019 ? Je trouve que donner la variation 2018-2019 puis 2019-2020 montre bien qu’on a une augmentation largement supérieure à la variation entre les années précédentes.

      Mais peut-être que je passe à côté d’un truc et que c’est autre chose que tu veux mettre en avant.

    • Ma suggestion serait que les données et les traitements soient partagés et rejouables, pour clarifier le propos et avancer ensemble plutôt que chacun·e dans son coin. Mais bon c’est juste une suggestion, même pas une demande.

    • @ericw, elle est très bien ta manière de présenter les chiffres ; c’est minimal, pas de référence composite type moyenne, plus simple ; je voulais quand même donner une référence "moyenne" (ce que fait aussi l’insee) comme complément et parce-que c’est habituel (il me semble).

      @fil pour les calculs globaux de surmortalité, on fait pas bien plus ici que ce qui est écrit plus haut ; pas de code ou de calculs compliqués ; « donc » pas de github :-) pour si peu ; les données sont reprises du rapport insee.

      Pour les courbes « tranches d’ages » que je montre en premier dans le post, je prends les données détaillées direct depuis l’insee ; la récupération, les petits calculs de moyenne et des graphes sont avec le reste de mes graphiques, ici : https://github.com/ofa-/predictor ; voir le Makefile pour la recup de données (make insee.fetch) et insee_dc.py pour les graphes ; contribution welcome.

    • Du coup, je regarde les 4 séries du fichier csv.
      (ce que je n’ai pas fait jusqu’ici)

      • les entrées en réa ont commencé à plafonner le 26/10, sont restées stables un peu plus d’une semaine avant de commencer une forte décrue
      • à l’œil, on peut considérer que les décès sont décalés de 15 jours
      • on aurait donc une semaine à peu près stable pour les décès et une décroissance à partir du milieu de la semaine prochaine (24/11 ?)
      • toujours à la louche, les radiations tournent autour de 5% du stock d’hospitalisations (un peu plus de 2 bandes de graduation d’écart avec un facteur 100 entre les 2 systèmes de graduation) soit environ un temps de séjour moyen de l’ordre de 20 jours (je sais, on n’est pas en régime stationnaire, mais on va faire comme si…)

    • pour l’extrapolation, c’est très empirique
      et j’ai affiné au fur et à mesure du temps
      • j’ai d’abord commencé par estimer une simple tendance exponentielle
      • devant la régularité d’horloge de la courbe en octobre (contrairement à ce que déclarent certains…), j’ai estimé le poids des jours de semaine (rapports à la tendance, moyennés, même pas centrés - leur moyenne fait presque 1,05)
      • que j’applique en extrapolation sur ma tendance

      ça c’était quand ça montait

      à partir du moment où ça ne monte plus, pas d’estimation de (la nouvelle) tendance possible, donc là, faut choisir, en gros entre stagnation ou retournement. De façon heuristique (doigt mouillé…), j’ai choisi la première, en appliquant les coefficients des jours de semaine calculés précédemment.

    • le décalage temporel entre les courbes réa et dc, je l’ai suivi depuis avril : c’est les +<nb> j sur mon graphique métropole, les tronçons rouge sont des bouts de la courbe réa, décalés, et un peu écrasés cf https://github.com/ofa-/predictor/blob/master/predictor.py#L134-L137

      ça marchait assez bien pour l’épisode 1, montée, descente, et environ pour les vacances d’été ; et ça marchait aussi pas mal sur une bonne partie de la montée de l’épisode 2 ;

      mais là ça colle plus depuis 1-2 semaines :-( ; ptet un pb avec mon scaling - il aligne les courbes en hauteur sur le pic de l’épisode 1.

      question interprétation, je voulais vérifier si on pouvait y voir un vague prédicteur de dc : en utilisant réa scaled+shifted, ça paraît vaguement intuitif, si on dit que réa = antichambre de la morgue ; du coup, on a +nb jours de prédiction de dc à peu de frais en translatant réa ; bon aussi, les deux phénomènes sont globalement de belles exponentielles, alors ça peut coller :-) mais la synchro est troublante, surtout sur une si longue période.

      aussi, j’ai l’impression que la « compression » (diminution de l’écart temporel entre les deux courbes) indique une phase de crise.

      un avis ?

    • Détails et explications

      – courbes réa et dc : moyennes 7 jours glissants (jours précedents)

      – ligne grise en pointillés subliminaux : 10% de la mortalité toutes cause habituelle / jour pour le département ou la zone (données insee détaillées 2018+2019, moyenne par mois)

      – courbe rouge sur vues métropole : « prédictor » = courbe réa légèrement écrasée et décalée de x jours

      – lignes vertes : regressions linéaires (log) sur les tronçons de courbes réa ; les billes vertes donnent le temps de doublement

      données : Santé Publique France (data.gouv.fr)
      > donnees-hospitalieres-nouveaux-[...].csv

      source : https://github.com/ofa-/predictor