La valeur p pour le modèle de régression forestière aléatoire

Xiaoyu Lu

2017-06-07 00:11:52 UTC

view on stackexchange narkive permalink

Un critique m'a donc demandé de fournir la "valeur P" pour mon modèle de régression forestière aléatoire.

J'ai essayé de faire des recherches à ce sujet, et je n'ai trouvé que des méthodes pour produire des valeurs p pour chaque condition de division (comme dans le package 'party'), et des valeurs p pour une importance variable (comme dans le package 'rfPermute').J'ai du mal à faire confiance aux valeurs p pour l'importance des variables car certaines variables très importantes ont des valeurs p> 0,9.

Toute entrée sur la façon de générer la "valeur p" générale pour une forêt aléatoire (s'il y en a une) serait appréciée.

valeur p de quoi?

J'ai donc signalé le "% Var expliqué" et le critique m'a demandé de fournir la valeur p.

Je vais répéter, _ "valeur p de quoi" _?

Vous pouvez toujours en faire un bootstrap, mais pourquoi le critique le voudrait-il?C'est peut-être le résultat le moins pertinent du RF.

@Repmat En effet, la forêt aléatoire amorce déjà un tas d'arbres de décision.Il est probable que l'examinateur de OP ne soit pas familier avec les forêts aléatoires et comment les interpréter.Il n'y a rien de fréquentiste en soi.

@markwhite, Je suis entièrement d'accord.Mon expérience a toujours été que vous ne devriez pas discuter avec les critiques, et encore moins essayer de les éduquer sur les statistiques car ils vont a) vous ignorer, b) rejeter l'article.Par conséquent, il est beaucoup plus facile de simplement bootstrap sur les données brutes, et d'ignorer complètement la distribution hypothétique sur laquelle nous en déduisons ou si le psudo R-carré d'un RF peut être considéré comme provenant d'une telle distribution.Mais je m'éloigne du sujet.

La digression est appréciée;à mon avis, le processus d'examen par les pairs est l'un des plus grands obstacles à l'avancement des méthodologies statistiques;de nombreux chercheurs appliqués ne poursuivent pas leur formation en statistique après avoir terminé leurs études supérieures.

@MarkWhite: (commentaire sournois obligatoire) certains chercheurs appliqués semblent arrêter leur formation statistique après leurs années de premier cycle et passer le reste de leur vie universitaire à oublier activement ce qu'ils ont appris.[Tout cela en proclamant haut et fort qu'ils n'ont pas besoin de statisticiens puants pour leurs applications ou leurs études.] (Https://www.youtube.com/watch?v=Hz1fyhVOjr4&feature=related)

La question est basée sur une confusion, mais cela peut être traité dans une réponse.De plus, l'existence d'une réponse positive implique que ce n'est pas trop flou pour obtenir une réponse.Je vote pour laisser ouvert.