$ p $ -valeur pour les asymptotiques non standard

Question:

bdeonovic

2016-02-02 19:50:11 UTC

view on stackexchange narkive permalink

Supposons que j'ai un résultat asymptotique comme

$$ \ sqrt {n} (T_n - \ theta) \ overset {D} {\ to} \ sum_ {i = 1} ^ k \ lambda_i X_i $$

où $ X_i $ sont indépendants $ \ chi ^ 2_1 $. c'est-à-dire que certaines statistiques de test $ T_n $ est asymptotiquement la combinaison linéaire de variables $ \ chi_1 ^ 2 $ pondérées. Puis-je obtenir des valeurs $ p $ à partir d'un tel résultat?

Édité avec les commentaires d'@Glen_b's à l'esprit

Deux réponses:

Christoph Hanck

2016-02-02 20:33:15 UTC

view on stackexchange narkive permalink

En supposant que vous connaissez le $ \ lambda_i $, la simulation est faisable.

Considérez

  library (MASS) k <- 3lambda <- c (.2 ,. 3, .4) # choisissez vos lambdas herereps <- 100000distr <- rep (NA, reps) for (i in 1: reps) {distr [i] <- sum (lambda * rchisq (k, 1))} distr < - sort (distr) teststat <- 2 # choisissez votre teststat icipvalue <- which.min (abs (teststat-distr)) / reps # en supposant un test unilatéralement à gauche

Donc efficacement, on "branche" la statistique de test teststat dans le cdf empirique, c'est-à-dire, on trouve la proportion de réalisations de la simulation qui (qui, pour représentants large, estime précisément la probabilité que ) une variable aléatoire de la distribution nulle prend une valeur inférieure (nous considérons ici un test unilatéral à gauche, avec des modifications évidentes à d'autres alternatives) que la statistique de test - c'est-à-dire la valeur $ p $:

Thomas Lumley

2020-05-31 10:31:27 UTC

view on stackexchange narkive permalink

Il existe deux approximations utiles et au moins trois calculs qui seraient exacts avec une précision arithmétique infinie.

Appelons la distribution $ Q (\ lambda) $ . Et écrivez $ \ bar \ lambda $ pour la moyenne de $ \ lambda $ et $ \ tau $ pour la moyenne de $ \ lambda ^ 2 $ .

Les deux approximations sont implémentées dans pchisqsum dans le package R survey

L'approximation de Satterthwaite est la manière la plus courante d'évaluer cette distribution en pratique. Il se rapproche de $ Q (\ lambda) $ par $ a \ chi ^ 2_d $ où $ a $ et $ d $ sont choisis pour obtenir la bonne moyenne et la bonne variance. Plus précisément, $ a = \ tau / \ bar \ lambda $ et $ d = k \ bar \ lambda ^ 2 / \ tau $ . Jusqu'à ce que vous soyez loin dans la queue droite, l'approximation de Satterthwaite est beaucoup plus précise qu'elle n'a le droit de l'être. De plus, dans le scénario courant où les $ \ lambda $ sont les valeurs propres d'une matrice, vous n'avez pas besoin de la composition propre: vous pouvez calculer l'approximation de Satterthwaite dans $ O (k ^ 2) $ temps pour les matrices générales et plus rapide pour les matrices spécialement structurées.

L'approximation du point de selle est moins précise pour les probabilités de queue modestes, mais beaucoup plus précise pour les petites probabilités - elle a une erreur relative uniformément bornée et l'erreur diminue comme $ k $ span> augmente. C'est le seul qui fonctionne pour de très petites probabilités de queue avec une arithmétique à double précision ordinaire.

Il existe deux méthodes de calcul assez anciennes qui fonctionnent bien. Celles-ci sont toutes deux implémentées dans le package CompQuadForm pour R. Ils obtiennent tous les deux une erreur d'arrondi catastrophique lorsque la probabilité de queue droite se rapproche de la machine epsilon et ils ralentissent pour de gros $ k $ .

La méthode de Farebrother représente la probabilité sous forme de série infinie dans les fonctions bêta. Il faut que les $ \ lambda $ soient positifs, et pour les gros $ k $ , le plus gros peut Ce n'est pas beaucoup plus grand que les autres. Vous pourriez penser que $ \ lambda $ négatif n'est pas important, mais cela vous permet de faire la même chose avec $ F $ distributions ayant le même dénominateur
La méthode de Davies tire parti du fait que vous pouvez simplement écrire la fonction caractéristique, qui peut ensuite être inversée par intégration numérique
Il existe une troisième méthode de calcul, due à Bausch, qui a de très bonnes limites d'erreur / effort dans des paramètres extrêmes tant que vous avez une arithmétique de précision arbitraire. Il l'a inventé pour un problème de théorie des cordes. Il a vraiment besoin d'arithmétique à précision multiple.

Il y a aussi quelques améliorations sur l'approximation de Satterthwaite

correspondant à plus de deux moments. À mon avis, ce n'est pas très attrayant: si vous avez tous les $ \ lambda $ , vous pouvez aussi bien utiliser les méthodes de Davies ou de Farebrother. Si $ k $ est grand et que vous n'avez que la matrice dont les valeurs propres sont les $ \ lambda $ , ces méthodes ne sont pas plus rapides qu'une composition électronique complète.
Approximation des valeurs propres principales.Lorsque $ k $ est grand, approximez la somme comme $ \ left (\ sum_ {i<m} \ lambda_i Z_i \ right)+ a_m \ chi ^ 2_ {d_m} $ , où le dernier terme est une approximation de Satterthwaite avec les plus petites valeurs propres de $ km $ .

Un élève et moi les avons examinés dans le grand cas $ k $ ;nous avons un article de blog et un article.

ⓘ

Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.

À propos - jargon juridique