Question:
Quelle est la différence entre la variance empirique et la variance?
Zia
2011-06-01 14:24:43 UTC
view on stackexchange narkive permalink

Pour autant que je sache, la variance est calculée comme suit

$$ \ text {variance} = \ frac {(x- \ text {mean}) ^ 2} {n} $$

while

$$ \ text {Variance empirique} = \ frac {(x- \ text {mean}) ^ 2} {n (n-1)} $$

Est-ce correct? Ou y a-t-il une autre définition? Veuillez expliquer avec un exemple ou toute référence pour lire sur ce sujet

J'ai utilisé Latex pour modifier la présentation de votre question. Si ce n'est pas ce que vous vouliez, faites-le moi savoir
Un répondre:
#1
+17
Henry
2011-06-01 14:46:10 UTC
view on stackexchange narkive permalink

Dans votre expression de la variance, vous devez prendre une somme (ou intégrale) à travers la population

$$ \ text {variance} = \ frac {\ sum_i (x_i- \ text {mean}) ^ 2} {n} $$

Si vos données sont un échantillon de la population, cette expression vous donnera une estimation biaisée de la variance de la population. Une estimation non biaisée serait la suivante (notez le changement du dénominateur de votre expression), souvent appelée la variance de l'échantillon

$$ \ text {Sample variance} = \ frac {\ sum_i (x_i- \ text {mean}) ^ 2} {n-1} $$

Si par contre vous essayiez d'estimer la variance de la moyenne de l'échantillon, alors vous auriez un nombre plus petit, plus proche de votre expression . La racine carrée de ceci est appelée erreur standard de la moyenne et une estimation raisonnable est

$$ \ text {Erreur standard} = \ sqrt {\ frac {\ sum_i ( x_i- \ text {mean}) ^ 2} {n (n-1)}} $$

Voir http://en.wikipedia.org/wiki/Bias_of_an_estimator#Sample_variance pour une explication pourquoi la variance $ 1 / n \ sum_ {i} (x_ {i} - \ bar {x}) ^ 2 $ est un estimateur biaisé, et http://vdov.net/~acosta/content/mle-normal/ pour une explication des raisons pour lesquelles il s'agit de l'estimateur du maximum de vraisemblance pour les variables normales.
Pourriez-vous préciser laquelle est appelée «variance empirique»?
@GuillaumeChérel - Je n'ai pas utilisé le mot «empirique» car le point que j'essayais de faire valoir est que la question clé est de distinguer entre l'estimation de la variance (ou écart-type) de la population et l'estimation de la distribution de l'erreur dans l'estimation de la moyenne.D'autres pourraient appeler toute estimation des paramètres à partir d'observations comme * empirique *
Je vois.En effet, le mot * empirique * est vague, et c'est précisément mon problème: je suis tombé sur le terme * variance empirique * en lisant un article présentant un algorithme que je souhaite implémenter.Je ne trouve aucun indice pour savoir si je devrais diviser la somme des différences au carré par $ n $ ou $ n - 1 $.J'ai donc supposé que les gens utilisant le terme * empirique * se référaient implicitement à l'un ou à l'autre.Une idée?
Juste une supposition, mais ils peuvent signifier "variance de l'échantillon" et ils peuvent être plus susceptibles de se diviser par $ n-1 $ lors du calcul


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...