Question:
La courbe pandémique COVID-19 est-elle une courbe gaussienne?
Samos
2020-03-22 20:14:53 UTC
view on stackexchange narkive permalink

Nous avons tous beaucoup entendu parler de "l'aplatissement de la courbe".Je me demandais si ces courbes - qui ressemblent à des cloches - peuvent être qualifiées de gaussiennes malgré le fait qu'il existe une dimension temporelle.

enter image description here

Eh bien, vous savez que la distribution gaussienne s'étend à l'infini dans les deux sens.Est-ce vrai pour cette distribution?
Les distributions gaussiennes @user76284 sont valablement utilisées comme modèles pour beaucoup de choses qui ne s'étendent même pas en principe à l'infini (scores de test?).Un exemple de physique: les vitesses sont en fait limitées par ± c, mais une distribution de vitesse gaussienne décrit les gaz de puits à température ambiante.
Aucune de ces courbes ne me semble gaussienne, ignorant que vous n'utiliseriez pas le terme pour les données temporelles.De plus, il semble évident que de tels graphiques seraient très simplifiés pour une consommation par un large public.
Je soupçonne qu'une bonne réponse à cette question devrait au moins prendre en compte des modèles d'épidémiologie mathématiques, en plus des chiffres réels.Voir https://en.wikipedia.org/wiki/Mathematical_modelling_of_infectious_disease pour une introduction à certaines des approches.Voir aussi https://en.wikipedia.org/wiki/Compartmental_models_in_epidemiology pour les modèles compartimentaux utilisant des équations différentielles.
Ces courbes ne sont pas des «distributions» au sens généralement entendu en probabilités et statistiques.Une courbe du taux de cas en fonction du temps qui semble gaussienne présenterait nécessairement une * accélération * de la croissance par rapport au début exponentiel suggéré par la plupart des modèles de transmission.Ceci est facilement vérifié en traçant des données * fiables * sur des échelles log-linéaires: la courbe aurait l'air parabolique.Presque * toute * courbe qui monte et descend, sans changement soudain de pente, peut être approchée avec une parabole, ce qui suggère que cette question pourrait ne pas conduire à des informations utiles ou à des procédures statistiques.
Douze réponses:
Alexis
2020-03-22 20:25:34 UTC
view on stackexchange narkive permalink

No.

Par exemple:

  • Pas au sens d'une distribution de probabilité gaussienne: la courbe en cloche d'une distribution normale (gaussienne) est un histogramme (une carte de densité de probabilité par rapport aux valeurs d'une seule variable), mais les courbes que vous citez sont (comme vous le remarquez) une carte des valeurs d'une variable (nouveaux cas) par rapport à une deuxième variable (temps). (@Accumulation et @TobyBartels soulignent que les courbes gaussiennes sont des constructions mathématiques qui peuvent ne pas être liées aux distributions de probabilité; étant donné que vous posez cette question sur les statistiques SE, j'ai supposé que le traitement de la distribution gaussienne était un partie importante de la réponse à la question.)

  • Les valeurs possibles sous une distribution normale s'étendent de $ - \ infty $ à $ \ infty $ , mais une courbe épidémique ne peut pas avoir de valeurs négatives sur l'axe y et se déplacer suffisamment à gauche ou à droite sur x , vous serez à court de cas, soit parce que la maladie n'existe pas, soit parce que l ' Homo sapiens n'existe pas.

  • Les distributions normales sont continues, mais les phénomènes que mesurent les courbes épidémiques sont en fait discrets non continus: ils représentent de nouveaux cas pendant chaque unité de temps discrète. Bien que nous puissions subdiviser le temps en unités significatives plus petites ( dans une certaine mesure), nous finissons par nous rendre compte que les personnes atteintes de nouvelles infections sont des données de dénombrement (discrètes).

  • Les distributions normales sont symétriques par rapport à leur moyenne, mais malgré le dessin animé véhiculant un message de santé publique utile sur la nécessité d'aplatir la courbe, les courbes épidémiques réelles sont fréquemment inclinées vers la droite, avec de longues queues minces comme indiqué ci-dessous.

Epidemic curve from the WHO Situation Report yellow fever in Angola, 15 September 2016: http://www.who.int/emergencies/yellow-fever/situation-reports/23-september-2016/en/

  • Les distributions normales sont unimodales, mais les courbes épidémiques réelles peuvent présenter une ou plusieurs bosses (c'est-à-dire qu'elles peuvent être multimodales, elles peuvent même, comme dans la réponse de @SextusEmpiricus, être endémiques oùils reviennent cycliquement).

  • Enfin, voici une courbe épidémique pour COVID-19 en Chine, vous pouvez voir que la courbe diverge généralement de la courbe gaussienne (bien sûr, il y a des problèmes avec la fiabilité des données, étant donné que de nombreux cas étaientnon compté):

COVID-19 epidemic curve, China, December 31, 2019–February 25, 2020

Je vous remercie.Le point 4 est vraiment bon.Il s'agit d'une simple approximation pour expliquer un phénomène qui ne reflète pas la vérité (cf. courbes bimodales en pays scandinave).
De plus, les données de comptage et la distribution asymétrique m'ont fait penser à la distribution de Poisson.
@Samos Poisson est une variation intéressante de votre question initiale!Cependant, tous mes points s'appliquent toujours (bien que le second nécessite quelques ajustements car Poisson a des hypothèses différentes de celles de Gauss, mais elles sont toujours violées par les épidémies. :)
Je suis d'accord avec les points 1 et 4, mais je pense que 2 et 3 manquent l'esprit de la question.De toute évidence, aucune donnée du monde réel ne sera * exactement * normale, mais seulement * approximativement * normale.En outre, il existe des distributions normales tronquées, et * toutes * les données sont discrètes car nous n'avons qu'un nombre fini de points d'échantillonnage.
@gardenhead Re Point 3, données ≠ distribution paramétrique (comme normale ou Poisson).Le point 2 a plus de nuances que je ne voulais pas approfondir.Vous êtes invités à ajouter une réponse de votre choix.:) Je suppose que vous êtes satisfait du point 5, même si les points 2 et 3 sont de très petites lentes à choisir.:)
Ce ne sont pas du tout des pinaillages, des distributions normales sont utilisées tout le temps pour des données discrètes (ou lorsque les limites de l'infini négatif et positif n'ont pas de sens), par exemple presque toutes les interrogations.Les points 2 et 3 sont tout simplement des arguments incorrects.De même, les distributions gamma sont utilisées pour les processus de poisson si certaines conditions sont remplies.La bonne façon de parler des points 2 et 3 est de soutenir que les hypothèses requises pour une approximation continue n'ont pas de sens.
@eps Je pense que vous supposez que je réponds à une question différente de celle posée.Je n'écrivais pas d'approximations ou de tests * nulle part * dans ma réponse.
La [définition] (https://en.wikipedia.org/wiki/Gaussian_function) donnée par wikipedia ne dit rien sur le fait qu'il s'agit d'une densité de probabilité.
Le premier point n'est pas valide non plus.Au moins les deux suivants sont techniquement corrects dans un sens pédantique (même s'ils manquent le point, puisque la courbe pourrait être approximativement gaussienne).Mais le premier point est complètement faux;une courbe gaussienne est une courbe gaussienne indépendamment de ce qu'elle représente.Ces trois premiers points distraient des deux derniers points corrects et pertinents.
@TobyBartels Recommanderiez-vous que la question soit migrée vers MO.SE?
@TobyBartels J'ai même expliqué plus clairement que le premier point concerne la probabilité.Je pense que c'est un point raisonnable à faire sur un site Web de statistiques.
Voulez-vous dire Math Overflow?Ce ne sont pas des mathématiques au niveau de la recherche, donc ça ne ferait pas partie de ça, mais ça irait bien en mathématiques.Je ne sais pas à quel point le CV est censé être large;cette question concerne certainement les statistiques dans un sens, mais peut-être pas dans le sens pertinent.
J'apprécie votre reformulation du n ° 1 et je reconnais que ce n'est plus incorrect.(Cela dit, je pense toujours que les points vraiment importants sont les deux derniers, et ils sont enterrés derrière les choses moins importantes de cette façon.)
Pourriez-vous expliquer la signification de la courbe épidémique dans votre dernier point?C'est un tracé cumulatif, alors ne vous attendez-vous pas à ce qu'il diverge d'un modèle gaussien instantané?
@EdwardBrey C'est un très bon point.(Je l'ai ajouté plus tard, en essayant de saisir rapidement une courbe épidémique C19, et légitime était trop rapide et bâclé à ce sujet. Bien qu'ils ne ressemblent pas non plus à des CDF nomaux. :) Je vais frapper cet ajout et trouver un meilleurimage à ajouter plus tard.Merci et va bien.
@EdwardBrey J'ai édité le dernier point avec une courbe épidémique (comptage) pour incorporer votre commentaire.
Sextus Empiricus
2020-03-22 20:40:26 UTC
view on stackexchange narkive permalink

Les courbes épidémiologiques des infections respiratoires sont des courbes très irrégulières. Voir par exemple l'épidémie de SRAS de 2002/2003

SARS https://www.who.int/csr/sars/epicurve/epiindex/en/index1.html

et pour les maladies endémiques, elles peuvent avoir des tendances saisonnières. Voir par exemple le logo euromomo

seasonal flu and common cold

Outre l'aplatissement de la courbe en général n'étant pas une courbe gaussienne, la situation sera également plus nuancée. L'image qui circule sur Internet est un cas très extrême où la courbe dépasse largement le seuil et est réduite de moitié en raison des mesures. Il a esquissé une situation parfaite pour plaider en faveur de mesures drastiques. Ce n'est peut-être pas nécessairement le cas avec covid-19.

Les représentations plus nuancées montrent des seuils différents et présentent des différences plus subtiles dans les courbes. Comme ici

curves with thresholds

https://www.vaccinarsinpuglia.org/notizie/2017/10/al-via-la-sorveglianza-dellinfluenza-stagione-2017-18

* "** Le ** été" * n'existe pas, donc aucune chance pour cela.C'est dommage pour tout le monde, mais avoir deux hémisphères sur une planète est probablement mieux à long terme.
Tim
2020-03-22 20:54:57 UTC
view on stackexchange narkive permalink

Je ne suis pas un épidémiologiste , et vous devriez poser cette question aux épidémiologistes.

Tout d'abord, dessiner des courbes gaussiennes est simple, car même un logiciel de traçage de base les a implémentées (par exemple Microsoft Excel), donc quand les gens ont besoin de dessiner "une distribution", ils dessinent souvent des Gaussiens. Les chiffres «aplatir la courbe» visent à montrer l'idée générale du phénomène, pas la distribution exacte de cette volonté et aurait pu se produire (personne ne le sait à l'avance, car il y a trop d'inconnues et trop de pièces mobiles). Même les échelles des chiffres ne sont pas réalistes; certains experts soulignent que la différence peut être beaucoup plus élevée que sur de tels chiffres.

En ce qui concerne la forme gaussienne de l'épidémie, pour autant que je sache, c'est ce qu'on appelle la loi de Farr. D'abord, le nombre de personnes infectées augmente, puis diminue, ce qui ressemble à une courbe gaussienne, mais c'est loin d'être un ajustement exact. Vous pouvez trouver une discussion dans ce fil Twitter, qui donne à titre d'exemple une étude qui a appliqué la loi de Farr pour prédire les cas de VIH / sida aux États-Unis, comme vous pouvez le voir sur l'intrigue, cela n'a rien à voir avec le résultat réel.

enter image description here

Vous pouvez trouver des chiffres, plus sérieux, dans le récent article largement cité de Ferguson et al (2020). Comme vous pouvez le voir, elles sont "montantes et descendantes, mais loin d'être gaussiennes, dans certaines simulations même multimodales, ou biaisées. Bien sûr, il s'agit toujours d'une simulation, donc une distribution beaucoup plus simplifiée que ce que l'on pourrait attendre des données réelles.

enter image description here

enter image description here

Comment tracer facilement une courbe en cloche dans Excel?Ou un programme de dessin comme Inksape?
@d-b Google pour ["excel normal distribution"] (https://www.google.com/search?q=excel+normal+distribution) et vous trouverez facilement des exemples.
Votre lien Farr indique "Cependant, l'écart type doit rester aussi proche que possible de 1 - c'est la caractéristique déterminante d'une courbe de Bell."ce qui est juste bizarre.Il n'y a rien de "définissant" à propos de sd = 1 (et à moins que nous ayons affaire à une quantité sans dimension, cela n'a même aucun sens).
Une distribution normale * standard * a une moyenne nulle et un écart type 1. Je me demande si la citation de Farr utilise la terminologie d'une manière également spécialisée.
La courbe noire (épidémie non atténuée) est très symétrique et pourrait facilement être confondue avec une courbe gaussienne.Étant donné que le nombre d'infections a un élément aléatoire et que les probabilités sont faibles mais non nulles aux deux extrémités (le virus peut avoir persisté sans être détecté plus longtemps que prévu), la forme n'est pas surprenante.Ce serait bien d'analyser les différences spécifiques.
Pere
2020-03-23 18:25:06 UTC
view on stackexchange narkive permalink

Pas mais (avec les bonnes hypothèses qui, en pratique, ne sont pas susceptibles de tenir) en quelque sorte.

Comme le souligne Michael Reid, le nombre de personnes infectées d'une épidémie dans des conditions constantes simplifiées (constante R0) est régi par l'équation logistique, qui conduit à un sigmoïde, la fonction logistique. Le dérivé de la fonction logistique est la courbe de densité en forme de cloche de la distribution logistique, ce qui n'est pas normal même si elle semble normale à première vue. Étant donné que le dérivé représenterait le nombre de nouvelles personnes infectées par unité de temps et que des paramètres courants tels que le nombre de décès par jour ou le nombre de nouveaux cas signalés par jour sont plus ou moins proportionnels à une version retardée et floue du nombre de nouvelles personnes infectées, ils suivent également une courbe similaire à la fonction de densité de distribution logistique.

Cependant, certaines hypothèses de l'équation logistique peuvent ne pas être valables pour l'épidémie de coronavirus - en fait, elles peuvent ne pas s'appliquer à une population réelle, bien que l'équation logistique soit un modèle courant et utile dans la dynamique des populations:

  • Dans l'équation dynamique, on suppose que toute la population se reproduit, c'est-à-dire que toutes les personnes infectées continuent d'infecter davantage de personnes. En réalité, à un moment donné, les personnes infectées cessent de propager l'infection.
  • Les conditions (R0) sont supposées constantes. Dans le monde réel, des mesures de contention sont introduites et donc R0 change.
«Constante R0» est un peu un faux pas: R0 s'applique au * cas d'index * dans le cas où * chaque * individu que cette personne rencontre peut être infecté.Une fois que vous avez la première transmission humaine humaine, ce n'est plus la situation, puisque la deuxième personne n'a aucune probabilité d'infecter la première.
Dans le modèle logistique, le nombre de personnes infectées par un individu est R0 multiplié par le taux de personnes non infectées.Par conséquent, une fois que vous obtenez la première transmission humaine, la probabilité de nouvelle infection diminue même si R0 reste constant.C'est la raison pour laquelle la courbe d'infection est sigmoïde et non exponentielle.En fait, c'est presque exponentiel alors que les personnes infectées ne représentent qu'une très petite partie de la population.
"des mesures de contention sont introduites et donc R0 change" ne devrait pas être "donc R change"
R0 change avec les mesures de contention car chaque personne infectée infecterait moins de personnes en moyenne en supposant que tout le monde peut être infecté.https://en.wikipedia.org/wiki/Basic_reproduction_number Si nous comprenons R (et non R0) comme le nombre réel de personnes infectées par une personne infectée, R change lorsqu'une partie de la population ne peut plus être infectée, comme l'a souligné Alexis,et donc R diminue naturellement de R0 à 0 - lorsque tout le monde est infecté.Veuillez noter que l'équation logistique ne prend pas en compte le fait que les gens cessent d'être infectieux à un moment donné, ce qui oublie l'immunité collective.
Cela devrait être la réponse acceptée.Merci pour l'info.
Acccumulation
2020-03-25 08:14:10 UTC
view on stackexchange narkive permalink

Il semble qu'il y ait trois questions ici:

  1. La distribution réelle des cas est-elle gaussienne? Non

  2. Les courbes données dans le graphique gaussien? Pas tout à fait.Je pense que le rouge est un peu biaisé et le bleu est définitivement biaisé.

  3. C Les tracés d'une valeur en fonction du temps peuvent-ils être considérés comme gaussiens? Oui.

En mathématiques, une fonction gaussienne, souvent simplement appelée gaussienne, est une fonction de la forme $$ f (x) = ae ^ {- {\ frac {(xb) ^ {2}} {2c ^ {2}}}} $$ pour les constantes réelles arbitraires a, b et c non nulles.

https://en.wikipedia.org/wiki/Gaussian_function

Il n'est pas nécessaire qu'il s'agisse d'une distribution de probabilité.

user953847-abecode
2020-03-23 10:21:01 UTC
view on stackexchange narkive permalink

Réponse courte, non.Je me demandais la même chose et j'ai trouvé un moyen de tracer les populations de personnes sensibles, infectées et rétablies.C'est un modèle appelé modèle compartimental d'épidémiologie et l'algorithme spécifique est appelé Algorithme de Gillespie.Il y a du code Python dans le deuxième lien mais je l'ai essayé dans R et il ressemble à ceci susceptible, green; infected, red; recovered, blue et voici le cahier si cela vous intéresse.

Il semble que quelque chose comme la distribution de Poisson serait plus proche, mais dans les bonnes conditions, nous pourrions approcher le Poisson avec une distribution normale / gaussienne.C'est l'interprétation généreuse.Les autres interprétations sont: 1, le CDC ne connaît en fait pas la bonne forme, ou 2, le CDC veut l'abattre pour la consommation publique.

Voir également https://www.youtube.com/watch?v=k6nLfCbAzgo
Si je comprends bien, vous suggérez qu'il serait possible d'ajuster la courbe rouge comme Poisson?(Sinon, ce qui suit est probablement sans importance, désolé)!La courbe peut correspondre à une courbe de Poisson * forme *, mais cela ne correspond pas à une distribution de Poisson.La * distribution * est discrète et n'a pas d'élément temporel.Vous pouvez adapter les décès / cas par jour à une distribution de Poisson (avec un taux variable), même si même dans ce cas, je suppose qu'un modèle sur-dispersé tel que le binôme négatif est un point de départ plus approprié.
Oui, merci de l'avoir signalé!Je suis en quelque sorte tombé dans le même piège / malentendu lié au sujet qui m'a rendu curieux en premier lieu, c'est-à-dire en utilisant la forme Gaussienne / Normale pour un phénomène temporel.
Michael Reid
2020-03-23 18:10:34 UTC
view on stackexchange narkive permalink

L'analyse la plus simple d'une épidémie conduit à un modèle de courbe logistique.Le taux de nouvelles infections sera le dérivé du nombre total de cas, ce qui, selon ce modèle, donnerait une courbe en forme de cloche (normal-ish au milieu mais avec des queues beaucoup plus grosses - voir le commentaire de Dirk ci-dessous).

Les hypothèses qui sous-tendent le modèle sont un taux de transmission constant, exactement comme ce serait le cas pour une croissance exponentielle, mais contrairement à la croissance exponentielle, il y a la présence d'une limite de saturation.Dans de nombreuses épidémies, la limite de saturation serait la population entière (c'est-à-dire que tout le monde aura finalement été exposé et acquis une immunité).Dans le cas du COVID-19, ce ne sera, espérons-le, pas le cas, donc un ajustement à la main sera nécessaire pour que la propagation limite à un sous-ensemble de la population entière.

Ma source pour cela était cette excellente vidéo YouTube 1.(Il existe peut-être une meilleure source que YouTube?)

La dérivée de la courbe logistique se désintègre comme exp (-x) et la gaussienne est plus rapide (comme exp (-x²)).
Oui, il existe deux relations intéressantes "logistique vs gaussienne": ** 1. ** comme dirk et [montrer ici] (https://stats.stackexchange.com/a/146874/251427), il y a un bon match;** 2. ** la distribution cumulative des deux est [presque la même] (http://visionlab.harvard.edu/Members/Anne/Math/Logistic_vs_Gaussian.html).
Itamar Mushkin
2020-03-24 17:31:19 UTC
view on stackexchange narkive permalink

Je ne suis pas épidémiologiste moi-même, mais une autre différence clé entre cette courbe et une courbe gaussienne est que la gaussienne se désintègre relativement rapidement (comme $ e ^ {- t ^ 2} $ après un certain temps $ t $ ), alors qu'une épidémie réelle devrait diminuer à un rythme beaucoup plus lent à la fin, voirepas de désintégration en $ 0 $ mais en une autre constante (espérons-le faible) - c'est-à-dire que le virus pourrait ne pas disparaître complètement comme le suggère la courbe gaussienne.

LeBorgne
2020-04-23 17:48:47 UTC
view on stackexchange narkive permalink

Non.Comme démontré ici sur différents pays, jusqu'à présent, un moyen raisonnable de modéliser les courbes des cas confirmés et des décès d'daily new pour Covid-19 est d'utiliser:

  • une exponentielle croissante au tout début
  • une courbe logistique lorsque la courbe commence à s'aplatir (voir la vidéo de 3Blue1Brown)
  • une exponentielle décroissante peu de temps après le premier pic
  • par la suite, nous pourrions manquer de données à dire.

Voir par exemple l'Italie au 22 avril 2020 (avec ajustement logistique avant le pic, exponentiel après):

enter image description here

En ce qui concerne les USA, le modèle logistique suffit jusqu'à présent:

enter image description here

Enfin, c'est plus difficile à dire pour la Chine:

enter image description here

veuillez ajouter des références complètes pour vos liens au cas où ils mourraient dans le futur, merci!
La distribution logistique ressemble beaucoup à la distribution normale.Elle peut être approximée par elle (voir l'approximation de Taylor de [cette courbe] (https://www.wolframalpha.com/input/?i=Log%28e%5E-x%2F%281%2Be%5E-x%29% 5E2% 29)) et est principalement différente dans les queues seulement (qui ne sont pas très pertinentes ici).L'essentiel: avec ces courbes qui ressemblent à des formes sigmoïdes, vous pourrez trouver beaucoup de correspondances (bien que comme le montre le cas chinois, ces courbes de formes sigmoïdes sont de fortes simplifications).
chrishmorris
2020-03-25 20:55:29 UTC
view on stackexchange narkive permalink

Au tout début d'une épidémie, la croissance est exponentielle.Les deux paramètres clés sont R0 (nombre moyen de personnes infectées par chaque personne qui l'attrape) et le temps d'incubation.L'objectif est de réduire R0 - une fois qu'il est inférieur à 1,0, l'épidémie est terminée.La plupart des comtés en sont encore à ce stade pour le COVID-19.

Une fois qu'une fraction significative de la population devient immunisée, un modèle exponentiel ne convient plus.Voir la bonne réponse de user953847 ci-dessus.

Sextus Empiricus souligne que les données réelles sont irrégulières.Cela est vrai de toutes les données réelles.Néanmoins, les modèles idéaux peuvent être utiles pour trouver et communiquer les tendances sous-jacentes aux irrégularités.

Qu'est-ce que R0?Comment cela se rapporte-t-il à la question?Existe-t-il une formule qui utilise R0?Quelle est la formule?
Dans l'exemple que je donne (la courbe du SRAS), vous pouvez voir que les données ne sont pas seulement bruyantes pour lesquelles un modèle idéal peut fournir un ajustement.Les données sont très irrégulières, vous pourriez mieux la décrire comme grumeleuse plutôt que granuleuse.Il a plusieurs composants, par exemple le pic très haut et mince au milieu est l'épidémie aux jardins d'Amoy.Il en est de même pour le taux de mortalité (la courbe EuroMomo '), ceux-ci affichent une onde de forme plus ou moins sinusoïdale mais avec des pics et des vallées très différents chaque année, et il y a aussi en hiver parfois un petit pic élevé lié à une épidémie de grippe.
Mike D.
2020-04-14 06:14:24 UTC
view on stackexchange narkive permalink

La croissance biologique (cumulative) d'épidémies virales, ou d'arbres, ou d'humains, ou d'autres phénomènes biologiques, suit en général la fonction logistique: 1 / (1 + e ^ -1). La courbe logistique est sigmoïde ou en forme de S. Il ne "s'aplatit" pas mais il a un point d'inflexion.

Le premier dérivé est le taux de croissance. Cette courbe suit la distribution logistique. Elle est en forme de cloche comme la courbe gaussienne, bien qu'elle soit différente. F (x) = e ^ -x / (1 + e ^ -x) ^ 2. Le pic de la courbe du taux de croissance est contemporain (car l'axe des x est le temps) avec le point d'inflexion de la courbe de croissance cumulative.

La deuxième dérivée est l'accélération. Il est en forme de S sur le côté, comme une onde sinusoïdale inclinée vers la droite. L'accélération passe par l'axe des x (égal à zéro) lorsque le taux culmine et que la croissance cumulée s'infléchit. Par la suite, l'accélération est négative (décélération) et après avoir plongé en territoire négatif, elle s'approche asymptotiquement de l'axe des x par le bas.

La fonction de Gompertz est un cas spécialisé de la fonction logistique générale, et est parfois utilisée pour les études de croissance car elle a des paramètres qui peuvent être résolus par régression linéaire. L'un des paramètres est l'asymptote supérieure de la courbe de croissance cumulative. Ce paramètre correspondrait au nombre total de décès ou au nombre total de cas si c'était ce que vous estimiez.

La distribution Weibull est également parfois utilisée, un autre cas spécialisé avec des paramètres. Nous avons utilisé le Weibull pour développer des modèles de croissance de peuplements d'arbres soi-disant individuels à l'époque où j'étais étudiant.

C'est le calcul de la croissance. Ce n'est pas «exponentiel» ou «logarithmique». C'est logistique.

Les courbes logistiques sigmoïdes s'aplatissent, mais elles ne s'inversent pas et ne redescendent pas, comme le peuvent les courbes épidémiques.Voulez-vous résoudre ce problème?
La courbe sigmoïde est la fraction de la population qui a été exposée;le nouveau taux d'infection (ou le nombre total de lits infectés ou d'hôpitaux) est la pente de ce sigmoïde (qui culmine, puis se désintègre).Ce modèle suppose que la propagation sature (plutôt que d'être supprimée et contenue).
meduz
2020-03-27 14:27:53 UTC
view on stackexchange narkive permalink

En fait, cette courbe semble bien correspondre à une distribution gausssienne inverse.Cette distribution est largement utilisée en psychologie ou en économie pour décrire la distribution des délais.IANAE (I Am Not An Epidemiologist ©), mais il existe des similitudes de ces processus avec une pandémie (où ce qui est indiqué dans le graphique par la variable $ x $ seradepuis le début de la pandémie):

typical IG distributions

Notez que pour certaines valeurs, elle ressemble à une distribution gaussienne en "cloche".La moyenne et l'écart type contrôlent le temps du pic et le "spread" de la courbe.

Pourriez-vous s'il vous plaît clarifier pourquoi la courbe pourrait être un bon modèle, mis à part la similitude visuelle?
J'espère que mes modifications vous aideront. Veuillez demander si vous avez besoin de plus de détails.
Si je comprends bien, vous suggérez que vous pourriez adapter la courbe à celle d'une gaussienne inverse?Bien que les courbes puissent s'adapter, ce n'est pas la même chose que l'ajustement à la distribution.La courbe que vous décrivez est définie dans le temps, tandis que la courbe de distribution définit la probabilité (densité) d'un seul échantillon prenant cette valeur - il n'y a pas d'élément temporel.
merci @owen88 pour le commentaire - il y avait beaucoup d'hypothèses cachées dans ma réponse.J'ai fait quelques modifications pour résoudre ces problèmes - j'espère que cela clarifiera les choses.
Vous soutenez que chaque individu a une sorte de vitesse pour acquérir le virus, que celui-ci est distribué normalement et que, par conséquent, la courbe épidémiologique du nombre d'infections est une gaussienne inverse.Mais, les événements d'infections ne sont pas * indépendants *.Il devrait y avoir une composante de croissance où le taux d'infections dépend du nombre actuel d'infections.--------- L'utilisation de ces distributions gaussiennes inverses est peut-être plus applicable en tant que petite partie dans une sorte de modèle mécaniste complexe.Par exemple, nous pourrions modéliser le «temps d'incubation» comme une gaussienne inverse.
Salut @meduz - Je ne suis toujours pas sûr de suivre.Peut-être la façon la plus simple de clarifier: quels sont les axes x et y dans votre graphique?La question originale avait des graphiques avec axese x = temps, y = non.cas.Si vous utilisez le même axèse, alors vous pouvez seulement dire que la forme peut sembler gaussienne inverse - mais ce n'est pas la même chose que les données suivant une distribution gaussienne inverse.
l'axe suit simplement les conventions habituelles telles qu'elles sont utilisées dans la littérature en général et dans wikipedia (I wikipedia) en particulier.donc oui.x = temps, et f (x) nombre de cas.tu as parfaitement raison.
IANAE = Je ne suis pas un épidémiologiste.commenter le commentaire d'@SextusEmpiricus - il est parfaitement juste de supposer qu'ils ne sont pas indépendants et que vous pouvez faire un modèle plus éduqué.au moins un gaussien inverse est * moins faux * qu'un gaussien, voir la question originale qui est "la courbe pandémique COVID-19 est-elle une courbe gaussienne?"et l'objectif de donner une telle réponse.
* "En fait, cette courbe est également bien décrite par une distribution gausssienne inverse. Cette distribution est largement utilisée en psychologie ou en économie et son utilisation est justifiée par les processus sous-jacents qui génèrent une telle courbe," * Elle n'est pas bien décrite par unla distribution gaussienne inverse et son utilisation n'est pas justifiée par le processus sous-jacent qui génère de telles courbes.Les différences de «vitesse pour tomber malade» ne représentent qu'une petite partie du processus total et n'ont qu'une faible influence sur la forme générale de la courbe.On ne doit pas s'attendre à ce que toute ressemblance soit fondée sur un principe mécaniste.
merci @SextusEmpiricus pour ce commentaire supplémentaire.mais cela se développe beaucoup plus que la question qui a été posée et plus vers la modélisation d'une épidémie complexe pour laquelle il existe une littérature abondante.J'ai de nouveau édité pour éviter de penser qu'il existe une telle chose comme une «vitesse à tomber malade».
@meduz - votre combinaison de définitions des axes x et y n'est pas cohérente avec l'idée de tracer une gaussienne inverse;en particulier, l'axe des y devrait être une densité de probabilité et non un décompte.
cher @owen88, ce graphique est tiré de wikipedia et pour obtenir un décompte, vous devriez envisager de multiplier la distribution par le dénombrement de la population.
Si vous mettez à l'échelle par population, vous supposez implicitement que la population entière obtiendra CV-19.Il semble que le modèle que vous proposez soit en fait un modèle sur l'espace des hyper-paramètres pour le gamma inverse.Mais c'est très différent de dire qu'elle suit une distribution gaussienne inverse (ce qui suggère un échantillonnage à partir de cette distribution - ce que vous n'êtes pas, si vous suggérez que nous pouvons mettre à l'échelle l'axe des y par population).Ceci est également en contradiction avec votre comparaison avec l'utilisation du gamma inverse pour mesurer les intervalles de temps.Si vous n'êtes pas d'accord, vous pourriez peut-être faire la lumière sur l'analogie avec les intervalles de temps?
oui, toute la population peut contracter le COVID-19.Ce n'est pas un modèle épidémiologique, mais une description de la dynamique que vous pouvez observer sur la population.Il est à mon avis important en SE de se concentrer sur la réponse à la question initiale, si vous souhaitez poser une question sur l'analogie avec les intervalles de temps, je serais heureux de répondre à votre propre question.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 4.0 sous laquelle il est distribué.
Loading...