Un grand échantillon de contrôle est-il préférable à une taille d'échantillon équilibrée lorsque le groupe de traitement est petit?

Question:

Heath

2013-10-05 00:57:56 UTC

view on stackexchange narkive permalink

Je mène une expérience sur les changements de volume cérébral dans une maladie rare. Nous avons un petit nombre de patients (n = 8) mais un grand groupe témoin (n = 100). Certains collègues ont suggéré qu'un groupe équilibré devrait être utilisé, à savoir. sélectionner 8 cerveaux témoins, mais je trouve cela contre-intuitif.

N'est-il pas plus judicieux d'utiliser l'ensemble du groupe témoin pour obtenir une meilleure estimation du volume cérébral de la population?

Voir ma réponse dans ce fil: http://stats.stackexchange.com/questions/54693/power-for-experimental-design/54717#54717 Fondamentalement, dans ce cadre, vous feriez p = 8/108. Je ne pense pas que vos collègues aient raison. L'algèbre de base vous permet de résoudre cette équation pour l'effet détectable minimum pour lequel vous êtes alimenté à la taille de votre échantillon.

Un répondre:

John

2013-10-05 01:53:20 UTC

view on stackexchange narkive permalink

Vos collègues ont tort.

Il est possible qu'ils fondent leur suggestion sur le fait que la robustesse des tests paramétriques typiques, comme un t -test, aux violations des hypothèses est gravement compromise avec des N déséquilibrés . Mais si vous ne les violez pas, un N plus élevé est préférable, même s'il est déséquilibré. Et vous pouvez toujours examiner l'effet de toute violation par simulation.

Un moyen simple d'imaginer pourquoi l'échantillonnage de 8 des 100 sujets de contrôle est une mauvaise idée, est de représenter deux graphiques de vos données qui diffèrent par le groupe de contrôle. Chacun a les mesures du volume cérébral du patient et du contrôle et un intervalle de confiance (IC) autour de chaque mesure. Dans chaque graphique, l'IC autour du groupe de test sera le même. Mais l'IC autour du groupe de contrôle sera beaucoup plus petit avec l'ensemble complet de 100 qu'il ne sera autour d'un échantillon de 8. Quel graphique aimeriez-vous présenter?

D'autres questions à vous poser pour décider si Pour utiliser les 100 échantillons de contrôle ou seulement 8, incluez: Selon vous, lequel a une meilleure estimation de la moyenne de contrôle? Lequel aurait une meilleure estimation de la variance de contrôle? Lequel est le plus représentatif de la population? La réponse à toutes ces questions est le groupe plus large. Et il est beaucoup plus important de relier des estimations précises de vos paramètres que les problèmes que vous pourriez rencontrer avec un test particulier.

REMARQUE : il est à distance possible que l'échantillon de contrôle de 8 CI soit plus petit que celui du groupe témoin complet. Cependant, cela signifierait probablement que votre échantillon de contrôle de 8 est un échantillon terrible et met en évidence pourquoi vous voulez vous en tenir à l'ensemble de données complet.

ⓘ

Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.

À propos - jargon juridique