Nous avons tous beaucoup entendu parler de "l'aplatissement de la courbe".Je me demandais si ces courbes - qui ressemblent à des cloches - peuvent être qualifiées de gaussiennes malgré le fait qu'il existe une dimension temporelle.
Nous avons tous beaucoup entendu parler de "l'aplatissement de la courbe".Je me demandais si ces courbes - qui ressemblent à des cloches - peuvent être qualifiées de gaussiennes malgré le fait qu'il existe une dimension temporelle.
No.
Par exemple:
Pas au sens d'une distribution de probabilité gaussienne: la courbe en cloche d'une distribution normale (gaussienne) est un histogramme (une carte de densité de probabilité par rapport aux valeurs d'une seule variable), mais les courbes que vous citez sont (comme vous le remarquez) une carte des valeurs d'une variable (nouveaux cas) par rapport à une deuxième variable (temps). (@Accumulation et @TobyBartels soulignent que les courbes gaussiennes sont des constructions mathématiques qui peuvent ne pas être liées aux distributions de probabilité; étant donné que vous posez cette question sur les statistiques SE, j'ai supposé que le traitement de la distribution gaussienne était un partie importante de la réponse à la question.)
Les valeurs possibles sous une distribution normale s'étendent de $ - \ infty $ à $ \ infty $ , mais une courbe épidémique ne peut pas avoir de valeurs négatives sur l'axe y et se déplacer suffisamment à gauche ou à droite sur x , vous serez à court de cas, soit parce que la maladie n'existe pas, soit parce que l ' Homo sapiens n'existe pas.
Les distributions normales sont continues, mais les phénomènes que mesurent les courbes épidémiques sont en fait discrets non continus: ils représentent de nouveaux cas pendant chaque unité de temps discrète. Bien que nous puissions subdiviser le temps en unités significatives plus petites ( dans une certaine mesure), nous finissons par nous rendre compte que les personnes atteintes de nouvelles infections sont des données de dénombrement (discrètes).
Les distributions normales sont symétriques par rapport à leur moyenne, mais malgré le dessin animé véhiculant un message de santé publique utile sur la nécessité d'aplatir la courbe, les courbes épidémiques réelles sont fréquemment inclinées vers la droite, avec de longues queues minces comme indiqué ci-dessous.
Les distributions normales sont unimodales, mais les courbes épidémiques réelles peuvent présenter une ou plusieurs bosses (c'est-à-dire qu'elles peuvent être multimodales, elles peuvent même, comme dans la réponse de @SextusEmpiricus, être endémiques oùils reviennent cycliquement).
Enfin, voici une courbe épidémique pour COVID-19 en Chine, vous pouvez voir que la courbe diverge généralement de la courbe gaussienne (bien sûr, il y a des problèmes avec la fiabilité des données, étant donné que de nombreux cas étaientnon compté):
Les courbes épidémiologiques des infections respiratoires sont des courbes très irrégulières. Voir par exemple l'épidémie de SRAS de 2002/2003
https://www.who.int/csr/sars/epicurve/epiindex/en/index1.html
et pour les maladies endémiques, elles peuvent avoir des tendances saisonnières. Voir par exemple le logo euromomo
Outre l'aplatissement de la courbe en général n'étant pas une courbe gaussienne, la situation sera également plus nuancée. L'image qui circule sur Internet est un cas très extrême où la courbe dépasse largement le seuil et est réduite de moitié en raison des mesures. Il a esquissé une situation parfaite pour plaider en faveur de mesures drastiques. Ce n'est peut-être pas nécessairement le cas avec covid-19.
Les représentations plus nuancées montrent des seuils différents et présentent des différences plus subtiles dans les courbes. Comme ici
Je ne suis pas un épidémiologiste , et vous devriez poser cette question aux épidémiologistes.
Tout d'abord, dessiner des courbes gaussiennes est simple, car même un logiciel de traçage de base les a implémentées (par exemple Microsoft Excel), donc quand les gens ont besoin de dessiner "une distribution", ils dessinent souvent des Gaussiens. Les chiffres «aplatir la courbe» visent à montrer l'idée générale du phénomène, pas la distribution exacte de cette volonté et aurait pu se produire (personne ne le sait à l'avance, car il y a trop d'inconnues et trop de pièces mobiles). Même les échelles des chiffres ne sont pas réalistes; certains experts soulignent que la différence peut être beaucoup plus élevée que sur de tels chiffres.
En ce qui concerne la forme gaussienne de l'épidémie, pour autant que je sache, c'est ce qu'on appelle la loi de Farr. D'abord, le nombre de personnes infectées augmente, puis diminue, ce qui ressemble à une courbe gaussienne, mais c'est loin d'être un ajustement exact. Vous pouvez trouver une discussion dans ce fil Twitter, qui donne à titre d'exemple une étude qui a appliqué la loi de Farr pour prédire les cas de VIH / sida aux États-Unis, comme vous pouvez le voir sur l'intrigue, cela n'a rien à voir avec le résultat réel.
Vous pouvez trouver des chiffres, plus sérieux, dans le récent article largement cité de Ferguson et al (2020). Comme vous pouvez le voir, elles sont "montantes et descendantes, mais loin d'être gaussiennes, dans certaines simulations même multimodales, ou biaisées. Bien sûr, il s'agit toujours d'une simulation, donc une distribution beaucoup plus simplifiée que ce que l'on pourrait attendre des données réelles.
Pas mais (avec les bonnes hypothèses qui, en pratique, ne sont pas susceptibles de tenir) en quelque sorte.
Comme le souligne Michael Reid, le nombre de personnes infectées d'une épidémie dans des conditions constantes simplifiées (constante R0) est régi par l'équation logistique, qui conduit à un sigmoïde, la fonction logistique. Le dérivé de la fonction logistique est la courbe de densité en forme de cloche de la distribution logistique, ce qui n'est pas normal même si elle semble normale à première vue. Étant donné que le dérivé représenterait le nombre de nouvelles personnes infectées par unité de temps et que des paramètres courants tels que le nombre de décès par jour ou le nombre de nouveaux cas signalés par jour sont plus ou moins proportionnels à une version retardée et floue du nombre de nouvelles personnes infectées, ils suivent également une courbe similaire à la fonction de densité de distribution logistique.
Cependant, certaines hypothèses de l'équation logistique peuvent ne pas être valables pour l'épidémie de coronavirus - en fait, elles peuvent ne pas s'appliquer à une population réelle, bien que l'équation logistique soit un modèle courant et utile dans la dynamique des populations:
Il semble qu'il y ait trois questions ici:
La distribution réelle des cas est-elle gaussienne? Non
Les courbes données dans le graphique gaussien? Pas tout à fait.Je pense que le rouge est un peu biaisé et le bleu est définitivement biaisé.
C Les tracés d'une valeur en fonction du temps peuvent-ils être considérés comme gaussiens? Oui.
En mathématiques, une fonction gaussienne, souvent simplement appelée gaussienne, est une fonction de la forme $$ f (x) = ae ^ {- {\ frac {(xb) ^ {2}} {2c ^ {2}}}} $$ pour les constantes réelles arbitraires a, b et c non nulles.
https://en.wikipedia.org/wiki/Gaussian_function
Il n'est pas nécessaire qu'il s'agisse d'une distribution de probabilité.
Réponse courte, non.Je me demandais la même chose et j'ai trouvé un moyen de tracer les populations de personnes sensibles, infectées et rétablies.C'est un modèle appelé modèle compartimental d'épidémiologie et l'algorithme spécifique est appelé Algorithme de Gillespie.Il y a du code Python dans le deuxième lien mais je l'ai essayé dans R et il ressemble à ceci et voici le cahier si cela vous intéresse.
Il semble que quelque chose comme la distribution de Poisson serait plus proche, mais dans les bonnes conditions, nous pourrions approcher le Poisson avec une distribution normale / gaussienne.C'est l'interprétation généreuse.Les autres interprétations sont: 1, le CDC ne connaît en fait pas la bonne forme, ou 2, le CDC veut l'abattre pour la consommation publique.
L'analyse la plus simple d'une épidémie conduit à un modèle de courbe logistique.Le taux de nouvelles infections sera le dérivé du nombre total de cas, ce qui, selon ce modèle, donnerait une courbe en forme de cloche (normal-ish au milieu mais avec des queues beaucoup plus grosses - voir le commentaire de Dirk ci-dessous).
Les hypothèses qui sous-tendent le modèle sont un taux de transmission constant, exactement comme ce serait le cas pour une croissance exponentielle, mais contrairement à la croissance exponentielle, il y a la présence d'une limite de saturation.Dans de nombreuses épidémies, la limite de saturation serait la population entière (c'est-à-dire que tout le monde aura finalement été exposé et acquis une immunité).Dans le cas du COVID-19, ce ne sera, espérons-le, pas le cas, donc un ajustement à la main sera nécessaire pour que la propagation limite à un sous-ensemble de la population entière.
Ma source pour cela était cette excellente vidéo YouTube 1.(Il existe peut-être une meilleure source que YouTube?)
Je ne suis pas épidémiologiste moi-même, mais une autre différence clé entre cette courbe et une courbe gaussienne est que la gaussienne se désintègre relativement rapidement (comme $ e ^ {- t ^ 2} $ après un certain temps $ t $ ), alors qu'une épidémie réelle devrait diminuer à un rythme beaucoup plus lent à la fin, voirepas de désintégration en $ 0 $ mais en une autre constante (espérons-le faible) - c'est-à-dire que le virus pourrait ne pas disparaître complètement comme le suggère la courbe gaussienne.
Non.Comme démontré ici sur différents pays, jusqu'à présent, un moyen raisonnable de modéliser les courbes des cas confirmés et des décès d'daily new pour Covid-19 est d'utiliser:
Voir par exemple l'Italie au 22 avril 2020 (avec ajustement logistique avant le pic, exponentiel après):
En ce qui concerne les USA, le modèle logistique suffit jusqu'à présent:
Enfin, c'est plus difficile à dire pour la Chine:
Au tout début d'une épidémie, la croissance est exponentielle.Les deux paramètres clés sont R0 (nombre moyen de personnes infectées par chaque personne qui l'attrape) et le temps d'incubation.L'objectif est de réduire R0 - une fois qu'il est inférieur à 1,0, l'épidémie est terminée.La plupart des comtés en sont encore à ce stade pour le COVID-19.
Une fois qu'une fraction significative de la population devient immunisée, un modèle exponentiel ne convient plus.Voir la bonne réponse de user953847 ci-dessus.
Sextus Empiricus souligne que les données réelles sont irrégulières.Cela est vrai de toutes les données réelles.Néanmoins, les modèles idéaux peuvent être utiles pour trouver et communiquer les tendances sous-jacentes aux irrégularités.
La croissance biologique (cumulative) d'épidémies virales, ou d'arbres, ou d'humains, ou d'autres phénomènes biologiques, suit en général la fonction logistique: 1 / (1 + e ^ -1). La courbe logistique est sigmoïde ou en forme de S. Il ne "s'aplatit" pas mais il a un point d'inflexion.
Le premier dérivé est le taux de croissance. Cette courbe suit la distribution logistique. Elle est en forme de cloche comme la courbe gaussienne, bien qu'elle soit différente. F (x) = e ^ -x / (1 + e ^ -x) ^ 2. Le pic de la courbe du taux de croissance est contemporain (car l'axe des x est le temps) avec le point d'inflexion de la courbe de croissance cumulative.
La deuxième dérivée est l'accélération. Il est en forme de S sur le côté, comme une onde sinusoïdale inclinée vers la droite. L'accélération passe par l'axe des x (égal à zéro) lorsque le taux culmine et que la croissance cumulée s'infléchit. Par la suite, l'accélération est négative (décélération) et après avoir plongé en territoire négatif, elle s'approche asymptotiquement de l'axe des x par le bas.
La fonction de Gompertz est un cas spécialisé de la fonction logistique générale, et est parfois utilisée pour les études de croissance car elle a des paramètres qui peuvent être résolus par régression linéaire. L'un des paramètres est l'asymptote supérieure de la courbe de croissance cumulative. Ce paramètre correspondrait au nombre total de décès ou au nombre total de cas si c'était ce que vous estimiez.
La distribution Weibull est également parfois utilisée, un autre cas spécialisé avec des paramètres. Nous avons utilisé le Weibull pour développer des modèles de croissance de peuplements d'arbres soi-disant individuels à l'époque où j'étais étudiant.
C'est le calcul de la croissance. Ce n'est pas «exponentiel» ou «logarithmique». C'est logistique.
En fait, cette courbe semble bien correspondre à une distribution gausssienne inverse.Cette distribution est largement utilisée en psychologie ou en économie pour décrire la distribution des délais.IANAE (I Am Not An Epidemiologist ©), mais il existe des similitudes de ces processus avec une pandémie (où ce qui est indiqué dans le graphique par la variable $ x $ seradepuis le début de la pandémie):
Notez que pour certaines valeurs, elle ressemble à une distribution gaussienne en "cloche".La moyenne et l'écart type contrôlent le temps du pic et le "spread" de la courbe.