Question:
Erreur statistique en ne contrôlant pas les variables?
JackOfAll
2015-12-04 02:59:20 UTC
view on stackexchange narkive permalink

Quand quelqu'un dit "On ne voit jamais une Ferrari rouiller comme une Honda", le défaut logique est qu'une Honda est généralement utilisée comme conducteur quotidien pendant les hivers rigoureux, tandis qu'une Ferrari est une 2e ou 3e voiture limitée à une utilisation le week-end ensoleillé.

De toute évidence, vous devez contrôler des variables telles que le kilométrage et les conditions météorologiques. Y a-t-il un nom pour cette erreur? Erreur logique? Erreur sur les taux de base? Différences entre les groupes comparés?

Il semble que le type de raisonnement auquel vous faites référence serait une sorte d'inférence de causalité à partir de la corrélation, et je ne sais pas s'il y a un bon nom pour cela, bien que l'erreur «post hoc» (de post hoc ergo propter hoc)pourrait fonctionner.
Cinq réponses:
gung - Reinstate Monica
2015-12-04 03:10:45 UTC
view on stackexchange narkive permalink

Vous pouvez l'appeler le biais de variable omis, (bien que cela n'ait pas de "erreur" dans le nom). C'est une forme d ' endogénéité; L ' erreur écologique, qui a une «erreur» dans le nom, est étroitement liée au biais de variable omis / à une autre forme d'endogénéité.

Pour ce que ça vaut, je ne suis pas sûr que la déclaration telle que vous la présentez ("Vous ne voyez jamais une Ferrari rouiller comme une Honda") est légitimement une erreur. C'est simplement une déclaration d'une observation empirique (et est vraisemblablement correcte). Si quelqu'un concluait que Farraris ne peut pas rouiller comme les Hondas, ce serait une erreur.

Penguin_Knight
2015-12-04 04:14:17 UTC
view on stackexchange narkive permalink

Pour autant que je sache, il n'y a pas une "erreur" nommée d'après confusion. Mais si quelqu'un a suggéré par erreur une relation causale (comme la marque de voiture et la rouille), nous avons appelé cela une "relation fallacieuse".

Carlos Cinelli
2017-11-21 03:28:44 UTC
view on stackexchange narkive permalink

Ce n'est pas une erreur statistique (associative), c'est une erreur logique d'une affirmation causale. Prenons la déclaration: "on ne voit jamais une Ferrari rouiller comme une Honda ". Statistiquement, cela signifie que la rouille observée dans la «population» de Ferrari est quelque peu différente de la rouille observée dans la «population» de Hondas. Cela pourrait être vrai et ce ne serait pas du tout une erreur statistique.

L'erreur entre en jeu lorsque quelqu'un l'utilise pour inférer que cette association observée est causée par un mécanisme spécifique, comme les qualités intrinsèques des Ferrari ou des Honda. Ainsi, lorsque vous prétendez: "le défaut logique est qu’une Honda est généralement utilisée comme conducteur quotidien pendant les hivers rigoureux, tandis qu’une Ferrari est une deuxième ou troisième voiture limitée à une utilisation le week-end ensoleillé" ce que vous faites explique un mécanisme causal possible qui conduit également à une telle association, de sorte que l'association observée ne peut pas exclure deux modèles causaux différents.

Par conséquent, même si l'association est légitime dans la population, ce qui pourrait ne pas être légitime est l'explication causale de cette association. Cette erreur logique consistant à déduire un mécanisme causal spécifique à partir d'une association est généralement appelée «fausse cause». Mais cette erreur n'est que la vieille simple "affirmation de l'erreur" conséquente - le modèle causal selon lequel les Ferrari sont meilleures que celles de Honda générerait l'association observée. Mais c'est une erreur de conclure que, parce que l'association est vraie, ce modèle causal spécifique est vrai. Il existe plusieurs modèles concurrents qui pourraient générer la même association observée, comme votre autre explication de la façon dont les Ferrari et les Honda auront des modes d'utilisation différents.

Cette association "fausse" peut survenir pour plusieurs raisons, non seulement en échouant à "contrôler" une variable.Quand cela est dû à un échec du contrôle d'une cause commune, nous appelons généralement ce "biais de confusion".Mais vous pouvez en fait créer une association non causale en contrôlant les mauvaises variables. Comme indiqué dans cette autre réponse, dans le modèle ci-dessous, "contrôler" le type de voiture appartenant au patient fausserait l'estimation de l'effet:

enter image description here

Ceci est généralement appelé "biais de collisionneur" ou "biais de sélection".Vous pouvez également avoir des biais dus au contrôle des médiateurs, à des erreurs de mesure, etc.

Aksakal
2015-12-04 03:10:00 UTC
view on stackexchange narkive permalink

Vous pouvez l'appeler confusion ou médiation en fonction de la relation exacte entre les variables de contrôle et les variables d'intérêt

Je pense qu'il veut un nom pour une erreur plutôt que pour le phénomène lui-même.
Deke
2015-12-11 05:30:57 UTC
view on stackexchange narkive permalink

"La corrélation n'implique pas de cause".

De toute évidence, CarMake a une très forte CORRELATION avec la rouille: CarMake = Honda a souvent de la rouille, CarMake = Ferrari n'a jamais de rouille.

Mais Cela ne signifie pas que CarMake CAUSE la rouille.Au lieu de cela, ConsumerDesireForLuxuryCar provoque CarMake = Ferrari, et ConsumerDesireForLuxuryCar cause également TakingCareOfCar qui provoque NoRust.

Je ne suis pas en désaccord avec les autres réponses, mais "La corrélation n'implique pas de causalité "est une expression très couramment utilisée dans les statistiques et elle capture succinctement cette situation (et bien d'autres aussi).

Je cherche le pas au-delà de "La corrélation n'est pas la causalité".C'est évident C! = C, mais POURQUOI la corrélation n'est-elle pas la causalité dans cet exemple de rouille?S'agit-il simplement de la variable cachée, du kilométrage ou de l'utilisation saisonnière?


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...