Il existe deux approximations utiles et au moins trois calculs qui seraient exacts avec une précision arithmétique infinie.
Appelons la distribution $ Q (\ lambda) $ . Et écrivez $ \ bar \ lambda $ pour la moyenne de $ \ lambda $ et $ \ tau $ pour la moyenne de $ \ lambda ^ 2 $ .
Les deux approximations sont implémentées dans pchisqsum
dans le package R survey
L'approximation de Satterthwaite est la manière la plus courante d'évaluer cette distribution en pratique. Il se rapproche de $ Q (\ lambda) $ par $ a \ chi ^ 2_d $ où $ a $ et $ d $ sont choisis pour obtenir la bonne moyenne et la bonne variance. Plus précisément, $ a = \ tau / \ bar \ lambda $ et $ d = k \ bar \ lambda ^ 2 / \ tau $ . Jusqu'à ce que vous soyez loin dans la queue droite, l'approximation de Satterthwaite est beaucoup plus précise qu'elle n'a le droit de l'être. De plus, dans le scénario courant où les $ \ lambda $ sont les valeurs propres d'une matrice, vous n'avez pas besoin de la composition propre: vous pouvez calculer l'approximation de Satterthwaite dans $ O (k ^ 2) $ temps pour les matrices générales et plus rapide pour les matrices spécialement structurées.
L'approximation du point de selle est moins précise pour les probabilités de queue modestes, mais beaucoup plus précise pour les petites probabilités - elle a une erreur relative uniformément bornée et l'erreur diminue comme $ k $ span> augmente. C'est le seul qui fonctionne pour de très petites probabilités de queue avec une arithmétique à double précision ordinaire.
Il existe deux méthodes de calcul assez anciennes qui fonctionnent bien. Celles-ci sont toutes deux implémentées dans le package CompQuadForm
pour R. Ils obtiennent tous les deux une erreur d'arrondi catastrophique lorsque la probabilité de queue droite se rapproche de la machine epsilon et ils ralentissent pour de gros $ k $ .
-
La méthode de Farebrother représente la probabilité sous forme de série infinie dans les fonctions bêta. Il faut que les $ \ lambda $ soient positifs, et pour les gros $ k $ , le plus gros peut Ce n'est pas beaucoup plus grand que les autres. Vous pourriez penser que $ \ lambda $ négatif n'est pas important, mais cela vous permet de faire la même chose avec $ F $ distributions ayant le même dénominateur
-
La méthode de Davies tire parti du fait que vous pouvez simplement écrire la fonction caractéristique, qui peut ensuite être inversée par intégration numérique
-
Il existe une troisième méthode de calcul, due à Bausch, qui a de très bonnes limites d'erreur / effort dans des paramètres extrêmes tant que vous avez une arithmétique de précision arbitraire. Il l'a inventé pour un problème de théorie des cordes. Il a vraiment besoin d'arithmétique à précision multiple.
Il y a aussi quelques améliorations sur l'approximation de Satterthwaite
-
correspondant à plus de deux moments. À mon avis, ce n'est pas très attrayant: si vous avez tous les $ \ lambda $ , vous pouvez aussi bien utiliser les méthodes de Davies ou de Farebrother. Si $ k $ est grand et que vous n'avez que la matrice dont les valeurs propres sont les $ \ lambda $ , ces méthodes ne sont pas plus rapides qu'une composition électronique complète.
-
Approximation des valeurs propres principales.Lorsque $ k $ est grand, approximez la somme comme $ \ left (\ sum_ {i<m} \ lambda_i Z_i \ right)+ a_m \ chi ^ 2_ {d_m} $ , où le dernier terme est une approximation de Satterthwaite avec les plus petites valeurs propres de $ km $ .
Un élève et moi les avons examinés dans le grand cas $ k $ ;nous avons un article de blog et un article.