En réponse partielle à cette question, je vais avancer un argument selon lequel le temps lui-même cannot soit une variable causale appropriée, mais il est légitime d’utiliser une variable «time» qui représente un état de nature particulier se produisant ou existant sur une période de temps spécifiée (qui est en fait une variable d'état). Ces problèmes sont à l'origine de la question elle-même, puisque mon intuition me dit que le «temps» dans un modèle causal doit être une sorte de proxy pour une sorte de variable d'état.
Le temps lui-même ne peut être une variable causale
Time est déjà une composante du concept de causalité: Le premier obstacle est le fait que le concept de causalité implique des actions , et les actions se produisent dans le temps. Ainsi, le «temps» est déjà intégré au concept de causalité. On pourrait donc le considérer comme un concept où le temps est a priori inadmissible comme variable argumentaire du concept. Pour affirmer que le temps est la cause d'un effet, il faut que le temps soit admis à la fois comme variable causale affirmée et comme concept nécessaire pour la causalité elle-même. (Nous verrons plus des effets de ceci ci-dessous.)
Si le temps cause quelque chose, il cause tout : Le deuxième obstacle est que la causalité est généralement considérée comme exigeant une condition contrefactuelle qui se réduit à la trivialité dans le cas où le temps est affirmée comme la variable causale. Si nous disons que "la condition préalable X provoque l'action Y", la condition contrefactuelle pertinente est que (1) la présence / l'occurrence de la condition préalable X signifie que l'action Y se produira; et (2) en l'absence d'une autre cause, l'absence de condition préalable X signifie que l'action Y ne se produira pas. Mais puisque «se produira» signifie «se produira avec le temps», l'utilisation d'un «temps» comme variable causale n'ajoute rien à la première exigence et fait de la seconde une tautologie. Si la condition préalable X est «le mouvement du temps» alors (1) se réduit à «le mouvement du temps signifie que l'action Y se produira», ce qui se réduit logiquement à «l'action Y se produira»; et (2) se réduit à "l'absence de mouvement du temps signifie que l'action Y ne se produira pas" (ce qui est une tautologie, puisque l'action ne peut que se produire dans le temps). Sous cette interprétation contrefactuelle de la causalité, une assertion de la causalité temporelle d'une action équivaut logiquement à une assertion que cette action se produira . Ainsi, nous devons soit conclure que cette condition est trop faible pour constituer une causalité (c'est-à-dire que le temps n'est une cause de rien) soit que le temps est la cause de tout .
Pure temps-causalité est métaphysiquement équivalent au hasard: Un autre obstacle se produit ici lorsque nous avons une situation où le «temps» est la seule variable causale affirmée (c'est-à-dire dans le cas de la causalité temporelle pure). Le problème est que si un changement dans une variable se produit au fil du temps, en l'absence de causalité d'une variable non-temporelle , cela a traditionnellement été considéré comme la définition même de aléatoire aléatoire - c'est-à-dire non causalité. Ainsi, affirmer que le temps est la seule cause d'un effet, c'est bannir entièrement la notion de non-causalité (aléatoire) de la métaphysique et la substituer par une «cause» de base toujours présente s'il n'y a pas d'autre cause. Alternativement, on pourrait raisonnablement affirmer qu'une affirmation de causalité temporelle est équivalente à une affirmation de caractère aléatoire - c'est-à-dire que c'est une affirmation qu'il n'y a pas de causes au changement, à part le passage temps. Si tel est le cas, alors la présence du «temps» comme variable causale dans un DAG équivaut à son absence (et donc la parcimonie conseille de l'exclure). De plus, l’histoire du terrain plaide en faveur du maintien de la terminologie existante de «hasard».
Problèmes avec le calcul causal avec le temps comme variable causale: Un autre obstacle final que je mentionnerai (il peut y en avoir plus) est qu'il est difficile de traiter le "temps" comme variable causale dans le calcul causal / em>. Dans le calcul causal standard, nous avons un opérateur $ \ text {do} (\ cdot) $ qui opère sur une variable causale pour refléter l'intervention dans le système pour changer cette variable à une valeur choisie qui peut être différente de ce qu'elle serait sous observation passive. Il n'est pas tout à fait clair qu'il soit possible d'imposer une «intervention» pour une variable temporelle, sans se heurter à d'autres principes philosophiques ou statistiques. On pourrait certainement soutenir que attendre est une intervention qui change le temps (en avant uniquement), mais même si cela était ainsi interprété, elle ne peut pas être différenciée de la passivité, et donc sans doute elle ne serait pas distincte de l'observation passive. . On pourrait à la place soutenir que nous pourrions enregistrer une grande quantité de données à des moments différents, et alors l '«intervention» consisterait à choisir quelles valeurs de temps sont incluses dans les données pour l'analyse. Cela impliquerait en effet un choix de périodes de temps (sur les données disponibles), et donc cela semble constituer une intervention, mais c'est une intervention épistémique , pas une intervention métaphysique une. (Cela pose également un problème secondaire de non-utilisation de toutes les données disponibles.)
Une variable d'état qui s'accumule au fil du temps peut être une variable causale
Les DAGs peuvent inclure des variables représentant des états de la nature se produisant pendant un temps prescrit: Il existe un certain nombre de variables causales légitimes qui représentent l'occurrence d'un état ou d'un événement sur une période de temps prescrite. Un exemple simple (chapeau à Carlos dans la réponse ci-dessous) est l'investissement d'argent au fil du temps, qui rapporte des intérêts. Dans ce cas, l'accumulation des intérêts est causée par le fait que l'argent est investi sur une période de temps, et plus la période d'investissement est longue, plus les intérêts courus sont élevés. Dans ce cas, il est légitime d'avoir une variable «temps», qui représente la période de temps choisie pour l'investissement, et cette variable aurait un impact causal direct sur les intérêts courus. De même, la variable "âge" pour une personne est une sorte de variable "temps" (pointe du chapeau à AdamO dans la réponse ci-dessous), représentant le fait que la personne a été en vie pendant une période donnée de temps. Chacune de ces variables sont des variables causales légitimes qui peuvent être incluses dans un DAG. Ces variables ne représentent pas la progression du temps lui-même - elles représentent le fait qu'un certain état de nature était présent sur une période de temps spécifiée. Dans de nombreux cas, il est utile d'étiqueter une variable comme celle-ci comme "temps", mais il est important de garder à l'esprit qu'elle représente un état spécifique sur une période de temps, plutôt que le progression du temps lui-même.
Dans un certain sens, chaque variable est de ce type: Puisque chaque événement ou état de nature possible se produit soit à un moment donné, soit sur une période de temps, chaque variable implique une spécification temporelle (souvent implicite). Néanmoins, il existe des variables telles que «âge» ou «temps investi» qui ont un lien plus direct avec le temps, dans la mesure où la variable représente la quantité de temps accumulé pendant lequel un état particulier a été obtenu.
Uutiliser "time" dans un DAG est un raccourci pour une variable d'état qui s'accumule au fil du temps: Si l'argument ci-dessus est correct, il semblerait que toute utilisation d'une variable "time" dans un DAG doit être un raccourci pour un variable représentant l'occurrence d'un événement particulier ou l'existence d'un état de nature particulier sur une période de temps spécifiée. La progression du temps elle-même n'est pas sujette au contrôle ou à l'intervention, et ne peut être une variable causale pour les raisons décrites ci-dessus. Cependant, la prévalence d'un état de nature particulier sur une période donnée peut être une variable causale légitime qui peut être incluse dans un DAG.
Ces points donnent une idée de base des raisons pour lesquelles l'utilisation du «temps» comme variable causale est problématique, et ce que signifie ajouter du «temps» à un DAG. Comme vous pouvez le voir, j'estime que le temps lui-même ne peut pas être une variable causale, mais que vous pouvez avoir une variable «temps» qui représente en fait un événement ou un état de nature se produisant ou existant sur une période de temps. Je suis ouvert à être convaincu du contraire, mais cela me semble être une solution raisonnable du problème.