Question:
Comment puis-je interpréter les résultats GAM?
mohammad gerami
2016-01-11 20:33:44 UTC
view on stackexchange narkive permalink

J'ai une question sur les modèles additifs généralisés. Qu'est-ce que la déviance, le score GCV et l'estimation de l'échelle dans les résultats GAM? Que montrent ces indicateurs?

Un répondre:
Gavin Simpson
2016-01-18 21:21:12 UTC
view on stackexchange narkive permalink

La déviance expliquée est un peu comme $ R ^ 2 $ pour les modèles où les sommes de carrés n'ont pas beaucoup de sens comme mesure de l'écart entre les observations et les valeurs ajustées. Dans les modèles généralisés, nous mesurons plutôt cet écart en utilisant la déviance . Il est calculé en utilisant la vraisemblance du modèle et a donc une définition mathématique quelque peu différente pour chaque distribution d'erreur (argument family dans glm () / gam () ). Dans le cas des modèles gaussiens estimés en GLM / GAM, la déviance et les sommes résiduelles de carrés sont équivalentes.

La déviance $ D $ d'un modèle est définie comme:

$$ D = 2 \ left [l (\ hat {\ beta} _ {\ mathrm {max}}) - l (\ hat {\ beta}) \ right] \ phi $$

où $ l (\ hat {\ beta} _ {\ mathrm {max}}) $ est la vraisemblance maximisée du modèle saturé et $ l (\ hat {\ beta}) $ est la vraisemblance maximisée du modèle que vous avez ajusté. Le modèle saturé est un modèle avec un paramètre pour chaque point de données; vous ne pouvez pas obtenir une probabilité plus élevée que cela, étant donné les données. $ \ phi $ est le paramètre d'échelle. L'écart mis à l'échelle est simplement

$$ D ^ {*} = D / \ phi $$

Ces écarts à l'échelle jouent un rôle dans les tests de rapport de vraisemblance , où la différence des écarts échelonnés pour deux modèles est $ \ sim \ chi ^ 2_ {p_1, p_2} $ (chi-carré distribué avec les degrés de liberté $ p_1 $ et $ p_2 $).

Déviance expliquée représente simplement ce qui précède comme la proportion de la déviance totale expliquée par le modèle actuel.

L ' estimation à l'échelle est $ \ hat {\ phi} $, c'est-à-dire valeur de $ \ phi $ estimée lors de l'ajustement du modèle. Pour les familles / distributions de Poisson et Binomiales, par définition $ \ phi = 1 $, mais pour les autres distributions ce n'est pas le cas, y compris la Gaussienne. Dans le cas gaussien, $ \ hat \ phi $ est l ' erreur standard résiduelle au carré .

Le score GCV est le score de validation croisée généralisée (GCV) minimisé du GAM ajusté. GCV est utilisé pour la sélection de lissage dans le package mgcv pour R; les paramètres de lissage sont choisis pour minimiser l'erreur de prédiction où $ \ phi $ est inconnu, et le CV ou GCV standard peut être utilisé pour estimer l'erreur de prédiction. GCv est préféré ici car il peut être calculé sans effectuer une validation croisée (réajustement du modèle en sous-ensembles de données), ce qui économise du temps et des efforts de calcul. La valeur rapportée est le score GCV minimisé (UBRE, Estimateur de risque non biaisé, les scores sont affichés à la place, vous ajustez un modèle avec $ \ phi $ connu), et vous pouvez utiliser ces scores un peu comme AIC, des valeurs plus petites indiquent un meilleur ajustement modèles.

Les GAM équipés à l'aide de la sélection de lissage GCV peuvent souffrir d'un sous-lissage. Cela peut se produire lorsque le profil GCV est relativement plat et qu'une variation aléatoire peut conduire à une convergence de l'algorithme à un ajustement trop instable. L'ajustement via REML (utilisez method = "REML" dans l'appel gam () ) ou ML a été montré par Simon Wood et ses collègues comme étant beaucoup plus robuste au sous-lissage, mais à des frais de calcul.

Les résumés ci-dessus sont basés sur les descriptions du livre plutôt excellent de Simon Wood sur les GAM:

Wood, SN (2006). Modèles additifs généralisés: une introduction avec R . Chapman et Hall / CRC.

@gavin.simpson y a-t-il une valeur gcv idéale ou est-elle juste relative comme AIC?
Je suppose que la valeur idéale pourrait être 0 (de près) car il s'agit d'un estimateur de l'erreur quadratique moyenne.Comme il utilise des écarts par rapport aux données observées, sa valeur dépend des valeurs de la réponse.Alors, traitez-le comme AIC dans le sens où plus petit est meilleur.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...