Question:
Quelle est la signification d'une valeur F inférieure à 1 dans une ANOVA à un facteur?
MYaseen208
2011-04-06 05:51:24 UTC
view on stackexchange narkive permalink

Qu'est-ce que cela signifie si la valeur F dans une ANOVA unidirectionnelle est inférieure à 1?

Rappelez-vous que le rapport F est

$$ \ frac {\ sigma ^ 2 + \ frac {r \ times \ sum_ {i = 1} ^ t \ tau_i ^ 2} {t-1}} {\ sigma ^ 2} $$

La formule est probablement incorrecte, car si $ r $ est positif (et il en juge toujours à partir de vos commentaires ci-dessous), la quantité dans la formule est toujours supérieure à 1. Ensuite, elle ne peut pas être distribuée comme distribution de Fischer, car variable aléatoire avec Fischer la distribution peut obtenir des valeurs inférieures à 1.
@mpiktas Bon point. @Bogdan explique la divergence dans une réponse. L'orthographe suggère que $ \ sigma $, $ r $ et $ \ tau $ sont * des paramètres, * pas des statistiques (comme le souligne @Jeromy), indiquant en outre que cette expression ne peut pas être la statistique F habituelle.
Sept réponses:
#1
+16
Jeromy Anglim
2011-04-06 08:53:51 UTC
view on stackexchange narkive permalink

Le ratio F est une statistique. Lorsque l'hypothèse nulle d'absence de différence de groupe est vraie, alors la valeur attendue du numérateur et du dénominateur du ratio F sera égale. En conséquence, la valeur attendue du rapport F lorsque l'hypothèse nulle est vraie est également proche de un (en fait ce n'est pas exactement un, à cause des propriétés des valeurs attendues des ratios).

Lorsque la valeur nulle l'hypothèse est fausse et il y a des différences de groupe entre les moyennes, la valeur attendue du numérateur sera plus grande que le dénominateur.

Cependant, le fait est que le numérateur et le dénominateur sont des variables aléatoires, tout comme le rapport F. Le rapport F est tiré d'une distribution. Si nous supposons que l'hypothèse nulle est vraie, nous obtenons une distribution, et si nous supposons qu'elle est fausse avec diverses hypothèses sur la taille de l'effet, la taille de l'échantillon, etc., nous obtenons une autre distribution. Nous effectuons ensuite une étude et obtenons une valeur F. Lorsque l'hypothèse nulle est fausse, il est toujours possible d'obtenir un rapport F inférieur à 1. Plus la taille de l'effet de la population est grande (en combinaison avec la taille de l'échantillon), plus le F la distribution se déplacera vers la droite, et moins nous aurons de chances d'obtenir une valeur inférieure à un.

Le graphique suivant extrait du G-Power3 montre l'idée donnée par divers La distribution rouge est la distribution de F lorsque H0 est vrai La distribution bleue est la distribution de F lorsque H0 est faux compte tenu de diverses hypothèses.Notez que la distribution bleue comprend des valeurs inférieures à un, mais elles sont très improbables. / p>

enter image description here

#2
+8
Theta30
2011-04-06 15:54:17 UTC
view on stackexchange narkive permalink

Votre question dans le titre est une question intéressante qui m'a également traversé l'esprit aujourd'hui. Je veux juste ajouter une correction. Le rapport F est: $$ \ frac {MS_ {traitement}} {MS_ {résiduel}} = \ frac {\ frac {SS_ {traitement}} {t-1}} {\ frac {SS_ {résiduel}} { t (r-1)}} $$ Ce que vous avez écrit est le $$ \ frac {E (MS_ {traitement})} {E (MS_ {résiduel})} $$ Alors que la première fraction peut être inférieur à 1, la seconde fraction ne peut pas être inférieure à 1. Mais ce n'est pas un problème car c'est un quotient des attentes.

#3
+4
Greg Snow
2011-07-01 20:45:42 UTC
view on stackexchange narkive permalink

Notez que si les valeurs de la statistique F inférieures à 1 peuvent survenir par hasard lorsque l'hypothèse nulle est vraie (ou presque vraie) comme d'autres l'ont expliqué, des valeurs proches de 0 peuvent indiquer des violations des hypothèses dont dépend l'ANOVA. Certains analystes examineront la zone à gauche de la statistique dans la distribution F comme une valeur p vérifiant les violations des hypothèses. Certaines des violations qui conduisent à de petites statistiques F incluent des variances inégales, une randomisation incorrecte, un manque d'indépendance ou tout simplement une simulation des données.

#4
+1
schenectady
2011-04-06 20:37:56 UTC
view on stackexchange narkive permalink

Le problème ici est que le test d'hypothèse implique un nul ET une hypothèse alternative, et donc; la région de rejet est déterminée par les deux hypothèses.

Prenons un exemple plus simple. Si vous étudiez un processus qui a peut-être une MOYENNE de zéro, mais qui ne peut pas avoir une moyenne inférieure à zéro, alors vous pourriez être intéressé à effectuer le test suivant

\ begin {équation} \ begin { array} {c} H_ {0}: \ mu = 0 \ H_ {1}: \ mu> 0 \\ end {array} \ nonumber \ end {equation}

à un niveau alpha. Votre région de rejet de l'hypothèse nulle est à droite de zéro. Il n'est pas impossible pour vous d'obtenir une moyenne d'échantillon qui est négative, quoique avec une faible probabilité. Si vous deviez obtenir une moyenne d'échantillon négative dans votre test, vous ne remettriez pas en question la véracité de l'expérience.

Maintenant, considérez votre question. La raison pour laquelle la région de rejet pour la statistique F est à droite est à cause de l'hypothèse alternative dans l'ANOVA à un facteur. Vous testez l'hypothèse que

\ begin {equation} \ begin {array} {c} H_ {0}: \ sum \ tau_ {i} ^ {2} = 0 \ H_ {1}: \ sum \ tau_ {i} ^ {2} \ ne 0 \\ end {array} \ nonumber \ end {equation}

L'hypothèse nulle dicte que vous utilisez la distribution F centrale, et l'hypothèse alternative , forcer la distribution vers la droite lorsque l'hypothèse alternative est vraie signifie que toute la probabilité d'erreur de type I doit être située sur la droite.

Est-il possible que la statistique de test soit inférieure à un? Lorsque l'hypothèse nulle est vraie, c'est certainement possible; tout comme dans l'exemple précédent où il était possible que la statistique de test soit négative même si le MOYEN des données est égal à zéro.

#5
+1
Henrik
2012-09-08 17:03:46 UTC
view on stackexchange narkive permalink

Après avoir cherché dans un dossier que je n'ai pas cherché depuis des années (comme un vrai dossier et non un dossier informatique), j'ai trouvé ce papier qui peut être intéressant pour cette question:

Voelkle, MC, Ackerman, PL, & Wittmann, WW (2007). Tailles des effets et ratios F < 1.0. Méthodologie: Revue européenne des méthodes de recherche pour les sciences du comportement et sociales , 3 (1), 35–46. doi: 10.1027 / 1614-2241.3.1.35

Le résumé dit:

Les textes statistiques standard indiquent que la valeur attendue du ratio $ F $ est de 1,0 $ (plus précisément : $ N / (N-2) $) dans une ANOVA à effets fixes complètement équilibrée, lorsque l'hypothèse nulle est vraie. Même si certains auteurs suggèrent que l'hypothèse nulle est rarement vraie en pratique (par exemple, Meehl, 1990), les ratios $ F $ $ < 1,0 $ sont assez fréquemment rapportés dans la littérature. Cependant, les statistiques de taille d'effet standard (par exemple, $ f $ de Cohen) donnent souvent des valeurs positives lorsque $ F < 1.0 $, ce qui semble créer une confusion sur la signification des statistiques de taille d'effet lorsque l'hypothèse nulle peut être vraie. Compte tenu de l'accent répété sur la déclaration des tailles d'effet, il est montré que face à $ F < 1,0 $, il est trompeur de ne rapporter que les estimations de taille d'effet de l'échantillon comme souvent recommandé. Les causes des ratios $ F $ $ < 1.0 $ sont passées en revue, illustrées par une courte étude de simulation. Le calcul et l'interprétation des statistiques de taille d'effet corrigées et non corrigées dans ces conditions sont discutés. Le calcul de mesures ajustées de la force d'association et l'intégration d'intervalles de confiance de la taille de l'effet sont utiles pour réduire la confusion entourant les résultats lorsque la taille des échantillons est petite. Des recommandations détaillées sont adressées aux auteurs, aux éditeurs de revues et aux relecteurs.

#6
  0
Ben Allen
2018-03-28 06:49:53 UTC
view on stackexchange narkive permalink

Un étudiant m'a posé une question similaire aujourd'hui.La réponse courte est que F est < 1 lorsqu'il y a plus de variance à l'intérieur des groupes qu'entre.

Voici un exemple de ceci:

Valeurs du groupe 1: 25, 50, 75 Valeurs du groupe 2: 26, 50, 75 Valeurs du groupe 3: 27, 50, 75

Il y a peu de différence entre les moyens de groupe:

Moyenne du groupe 1 = 50,00 Moyenne du groupe 2 = 50,33 Moyenne du groupe 3 = 50,66

Mais les différences au sein des groupes par rapport aux moyennes des groupes sont relativement importantes.La plupart des scores diffèrent d'environ 25 points de la moyenne:

Valeurs du groupe 1: -25, 0, 25 Valeurs du groupe 2: -24,33, -0,33, 24,66 Valeurs du groupe 3: -23,66, -0,66, 24,33

Ce scénario entraîne une grande variance au sein des groupes (600,55) et une faible variance entre (0,33).

Le résultat est un rapport F de 0,00055!

#7
-1
Komal Shekhawat
2016-03-16 12:19:40 UTC
view on stackexchange narkive permalink

Si la valeur F est inférieure à un, cette somme moyenne des carrés due aux traitements est inférieure à la somme des carrés due à une erreur.Par conséquent, il n'est pas nécessaire de calculer F l'hypothèse nulle est vraie tous les échantillons sont également significatifs.



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 2.0 sous laquelle il est distribué.
Loading...