Question:
Quelle est la probabilité qu'une personne meure le jour de son anniversaire?
jbranchaud
2013-12-28 22:27:02 UTC
view on stackexchange narkive permalink

Je suis curieux de savoir quelle est la probabilité qu'une personne meure le jour de son anniversaire?

Je suis sûr qu'il existe plusieurs façons d'aborder cela, et j'ai entendu dire que les chiffres réels indiquent un taux plus élevé pour les anniversaires, c'est pourquoi je le demande ici.

Probabilité que quand ils mourront, ce sera leur anniversaire? Ou la probabilité que le jour de leur (n-ième) anniversaire, ils mourront? En d'autres termes, déterminez le champ de probabilité, le résultat et la condition.
@ttnphns le premier, mais j'aime la distinction.
Ça dépend s'ils aiment leurs cadeaux
Six réponses:
Mike Shi
2013-12-28 22:53:47 UTC
view on stackexchange narkive permalink

Désolé, un peu nouveau ici, alors veuillez m'excuser si cela ne vous aide pas trop.

L'administration américaine de la sécurité sociale tient des registres des naissances et des décès et a leurs informations disponibles à l'achat (apparemment pour un prix élevé): Ici

Cependant, j'ai trouvé une source qui prétend l'avoir acheté et l'offre gratuitement (en plus d'offrir les données triées par date sur le site ): Ici

Je suppose que vous pouvez simplement l'utiliser comme exemple et parcourir toutes les données avec un script et trouver combien de personnes meurent réellement le jour de leur anniversaire. Je le ferais moi-même mais il me reste 20 minutes à télécharger (ils sont environ 1,5 Go) donc je vais essayer de vous revenir moi-même sur les statistiques si je trouve le temps de rédiger un script.

Bien sûr, les États-Unis ne peuvent pas représenter l'ensemble de la population mondiale, mais c'est un bon début. Je suppose que vous verrez un taux plus élevé de décès lors des anniversaires en raison des "problèmes du premier monde", car nous utilisons les États-Unis et je pense que l'effet serait moins visible à travers le monde ...

Mise à jour - Numéros: D

J'ai parcouru le fichier principal des décès de la sécurité sociale à partir de la source gratuite, il n'y a donc aucun moyen de savoir si les informations sont valides. Cependant, étant donné leur taille d'environ 3 gigaoctets chacun et qu'il n'y a aucune raison pour quiconque d'usurper ce type de fichiers ... je suppose qu'ils sont valides.

Vous pouvez voir le code qui J'avais l'habitude de le parcourir ici: http://pastebin.com/9wUFuvpN

Il est écrit en C #, il lit les lignes de l'index de la mort une par une, puis analyse la date à l'aide de regex. J'ai supposé que le fichier était essentiellement de ce format:

  `(Numéro de sécurité sociale) (Prénom) (Nom) (Deuxième prénom) (Une lettre) (MM-JJ-AAAA du décès) (MM-JJ-AAAA de naissance) ` 

J'avais regex juste choisir la dernière partie pour les dates de naissance / décès, vérifiez si l'un des champs est juste 0 (ce que je suppose que cela signifie que la sécurité sociale n'a pas pu obtenir un mois / une date valide pour l'enregistrement) et supprimez les 0. Ensuite, il vérifiera si le jour de la naissance et le mois de naissance correspondent au jour du décès / mois du décès et l'ajoutera au décompte des anniversaires. Il ajoutera tous les enregistrements qui ne sont pas des 0 au nombre de décès.

Il affiche les résultats dans ce format:

Décès à l'anniversaire / Nombre total de décès examinés - Les personnes avec un 0 dans l'un de leurs enregistrements

Ce serait génial si quelqu'un pouvait vérifier ce code, car j'ai trouvé pas mal d'erreurs que j'ai faites auparavant et je ne peux que le dire parce que mes résultats n'avaient aucun sens statistique.

Voici la sortie de la console: Console Output

Faire des calculs ...

  • Le fichier 1 avait 44665 décès à un anniversaire sur 14879058 décès au total
  • Le fichier 2 comptait 47060 décès à un anniversaire sur 15278724 décès au total
  • Le fichier 3 comptait 49289 décès à un anniversaire sur 15374049 Décès au total
  • Au total, nous avons 141014 décès à un anniversaire sur 45531831.

Nous avons donc ~ 0,3097% de chances de mourir le jour d'un anniversaire alors que statistiquement (1 / 365) nous amènerait à croire qu'il n'y a que ~ 0,27397% de chances de mourir le jour d'un anniversaire. C'est en effet une augmentation de 13% des chances de décès à un anniversaire à partir de 1/365. Bien sûr, cet échantillon ne concerne que les Américains et ne compte que 45 millions d'enregistrements, je suis sûr que les organisations qui ont initialement publié leur article avaient accès à des indices de décès beaucoup plus fiables et plus volumineux. Cependant, je pense qu'il est en effet valable que les décès à un anniversaire sont plus probables que la mort à tout autre jour.

Voici un article de Time citant des sauts dans les raisons de la mort lors des anniversaires: Article

Edit 2: @cbeleites a fait remarquer que j'avais oublié de tenir compte des décès le jour même, ce qui serait un facteur énorme dans l'augmentation des décès les anniversaires. À proprement parler, mes données sont toujours valables mais je n'ai pas rejeté si une personne décédait le jour même de sa naissance. Il est intéressant de noter que mes résultats n'ont pas été trop affectés par cette erreur, il semble donc que ces enregistrements n'incluent pas la mort le premier jour. Je l'examinerai plus tard. Je pense qu'il y aurait des statistiques très intéressantes que je pourrais rechercher, comme la mort certains jours du mois, et créer une carte thermique. J'essaierai probablement de le faire un jour ...

Non, c'est intéressant aussi. J'espérais réfléchir à cette question au-delà du simple «1/365».
Pouvez-vous publier un lien vers les données gratuites?
Désolé, j'ai raté le collage du deuxième lien. Je l'ai corrigé sur mon message, mais vous y voilà: http://ssdmf.info/download.html Je ne peux actuellement pas faire le script car j'ai des applications universitaires à terminer et les fichiers font 2 Go chacun ... :(
Vous devez prendre en compte les erreurs de compte dues aux statistiques de comptage. En gros, l'incertitude relative dans ces calculs sera d'environ 1 / sqrt (47000) = 0,5%. Ces différences ne sont donc pas statistiquement significatives.
@Dave31415: Le dénominateur $ \ sqrt {45531831} $ n'est-il pas?Cela le rend statistiquement très significatif.
cbeleites unhappy with SX
2013-12-30 00:47:54 UTC
view on stackexchange narkive permalink

Nous pouvons être encore plus précis que les données de @Mike Shi: le plus dangereux de tous les anniversaires est le tout premier.

Les taux de mortalité au premier jour qui y sont signalés sont d'environ 0,2% pour les pays industrialisés et 0,8% en moyenne pour tous les pays. Ce qui signifie que le risque de mourir le jour de la naissance est au moins aussi élevé que le risque de mourir à n'importe quel des jours de naissance suivants *.

* Je pense que c'est une hypothèse sûre que les décès au premier jour n'apparaissent pas dans le fichier de @Mark Shi, car les taux de mortalité au premier jour aux États-Unis sont de 0,3% ( autre source: 0,26%). C'est à peu près le taux de mortalité total à la naissance dans le fichier de la sécurité sociale. Donc, soit les bébés qui meurent le jour de la naissance n'obtiennent pas de numéro de sécurité sociale, soit mourir un jour de naissance> 1 an est extrêmement improbable.


note latérale:
Il y a d'autres jours, comme Chirstmas et New Year Eve, qui sont connus pour avoir des taux de mortalité supérieurs à la moyenne également.

Ah oui, j'ai oublié de rendre compte des décès survenant le même jour que la naissance. Je suppose que cela a été exclu des données car l'hôpital devrait soumettre ces données à l'État pour un certificat de naissance et ils ne soumettraient pas de données sur les bébés qui meurent, je suppose. Cela m'a conduit à une série de recherches maladroites sur Google ... "les bébés morts obtiennent-ils un numéro de sécurité sociale" ...
Alecos Papadopoulos
2013-12-29 00:44:06 UTC
view on stackexchange narkive permalink

Voici un argument expliquant pourquoi la probabilité de décès à l'anniversaire peut être plus élevée que les autres jours: les anniversaires sont des jours chargés d'émotion. De plus, les gens ont tendance à le célébrer d'une manière ou d'une autre. Il y a donc un excès de facteurs (par rapport au style de vie habituel de la personne) qui augmentent le stress biologique (excès d'émotions, excès d'alcool, excès d'alimentation, excès de danse, excès de banjee jump etc.). Statistiquement parlant, cette situation augmente les chances de mourir le jour d'un anniversaire, car elle intensifie les problèmes de santé qu'une personne peut avoir, ou parce qu'elle l'expose à des situations et des risques pour lesquels la personne est inexpérimentée.

sûr.mais plutôt que de spéculer, mesurons :)
Je pense qu'il devrait en fait être plus bas.Aux États-Unis, plus de naissances ont lieu vers août et la plupart des décès surviennent en hiver à cause du froid.Mais peut-être que l'effet de trop de gâteau et de boire éclipse la saisonnalité :)
Stat
2013-12-29 00:31:45 UTC
view on stackexchange narkive permalink

La probabilité qu'un nouveau-né meure dans l'année se trouve dans les tables de mortalité. Par exemple, vous pouvez consulter les tables de mortalité périodiques et consulter la colonne $ q_x $ pour $ x = 0 $ dans la base de données sur la mortalité humaine. Ce n'est pas exactement ce que vous voulez, mais cela vous donnera une idée.

kjetil b halvorsen
2018-03-26 02:48:03 UTC
view on stackexchange narkive permalink

En plus des autres excellentes réponses, mais il y a un point dont aucune n'a discuté: les anniversaires ne sont pas uniformément répartis sur l'année, pas plus que les jours de mort. Cela conspire de telle sorte que la probabilité "statistique" est not 1/365. Pour avoir une idée de cet effet, supposons d'abord qu'ils sont tous les deux presque uniformes, seul le 29 février a une probabilité 1/4 des autres. Ça donne $$ 365 p + \ frac14 p = 1 $$ donc $ p = 0,002737851 $ . Cela conduit à une probabilité de naissance et de décès le même jour égale à 356 $ \ cdot p ^ 2 + (p / 4) ^ 2 = 0,002736445 > 0,00273224 = \ frac1 {366} $ span> qui est la valeur minimale possible (avec 366 jours).

Avec un peu plus de généralité, considérons $ p_i, i = 1, \ dotsc, n $ les probabilités d'anniversaire et $ q_i, i = 1, \ dotsc, n $ les probabilités du jour de la mort, pendant un an avec $ n $ jours. Ensuite, si l'anniversaire et le jour de décès d'une personne sont statistiquement indépendants, nous constaterons que $$ \ DeclareMathOperator {\ P} {\ mathbb {P}} \ P (\ text {Naissance et décès le même jour}) = \ sum_ {i = 1} ^ n p_i q_i $$ donc si $ p_i = q_i $ alors c'est $ \ sum_i p_i ^ 2 $ . C'est une quantité connue (en biologie) comme indice Simpsons de (bio) diversité. Son inverse pourrait alors être pris comme "nombre effectif de jours (dans un an)"! La valeur minimale de $ \ sum_i p_i ^ 2 $ est $ 1 / n $ . Pour voir cela, utilisez la convexité.

Mais en supposant que $ p_i = q_i $ est assez exagéré, examinons d'abord certaines données, les probabilités d'anniversaire pour la Norvège calculées à partir des données de ssb.no:

enter image description here

Manifestement pas uniforme, la valeur aberrante la plus élevée est le 1er juillet. Ce n'est pas réel, il est causé par des immigrants sans anniversaire documenté enregistré cette date. Un maximum au printemps, vers début avril, un autre maximum en automne, en septembre. L'indice Simpson calculé à partir de cela est 0,002750224 $ , et l'inverse est $ 363,6067 $ , donc le "efficace nombre d’anniversaires »est d’environ 363 ans et demi, plutôt proche de 366. La non-uniformité n’est donc peut-être pas trop importante. Il est plus difficile de trouver des données pour le jour de la mort, mais j'ai trouvé que le journal (en norvégien) (il s'agit du journal officiel de l'association médicale norvégienne) rapporte un taux de mortalité environ 12% plus élevé en hiver que en été. Ils rapportent également un risque légèrement accru de décès le lundi! En fait, les comparaisons internationales rapportées par cet article montrent que la surmortalité hivernale est la plus faible en Scandinavie, dans des pays comme l'Irlande ou l'Angleterre, elle est environ le double. Cela pourrait être surprenant, peut-être avoir à voir avec nous, Scandinaves, ayant des maisons plus chaudes et mieux isolées?

À partir de là, nous pouvons reconstruire une distribution du jour de la mort. Je considère la demi-année d'hiver comme novembre-avril. Ensuite, nous pouvons calculer $$ p_w = 1,12 p_s \\ (182 \ cdot 1.12 + 184) p_s = 1 $$ menant à $ p_s = 0,002578383, p_w = 0,002887789 $ et enfin $ \ sum_i p_i q_i = 0,00273151 $ , son inverse, le "nombre effectif de jours" étant de 366,1, assez proche de 366! L'anticorrélation ( $ \ rho (p_i, q_i) = - 0.06 $ ) semble compenser la non-uniformité de telle manière que nous pourrions également supposer l'uniformité (et une distribution égale pour l'anniversaire et le jour de la mort). C'est assez intéressant.

EDIT: Voici un article publié sur la non-uniformité du problème de l'anniversaire.

Johnny Hopkins
2017-02-22 06:21:09 UTC
view on stackexchange narkive permalink

1 sur 365 serait la bonne cote, car vous êtes assuré de mourir un jour sur 365 jours par an ... Par conséquent, les chances sont de 1 sur 365.

Comment expliquez-vous la prétendue observation (dans la question, appuyée par la réponse de Mike Shi) selon laquelle davantage de personnes meurent le jour de leur anniversaire?Se pourrait-il que votre hypothèse selon laquelle la mort est également probable tous les jours pourrait être erronée?Serait-ce, par exemple, que la raison suggérée par Alecos (dans sa réponse) s'applique?Vous devez justifier votre hypothèse ou aborder d'une autre manière les informations contenues dans la question et les autres réponses pour expliquer pourquoi cela ne pose pas de problème pour votre hypothèse.Il peut y avoir un tel argument, mais vous devez l'offrir, pas seulement espérer que c'est vrai.
Sur un point sans rapport, nous devrions clarifier les termes utilisés ici.Vous décrivez une * probabilité *, pas une * cote *.Il pourrait être utile de lire ma réponse ici: [Interprétation de simples prédictions sur les rapports de cotes dans la régression logistique] (http://stats.stackexchange.com/a/34638/7290).


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...