Estimation de l'emplacement du phare bayésien

Pieter

2017-01-06 23:00:09 UTC

view on stackexchange narkive permalink

J'essaie d'apprendre Stan en R et comme défi amusant, j'essaie d'estimer l'emplacement d'un phare en fonction des éclairs observés. Mais les modèles que j'ai essayés ne convergent pas (Rhat! = 1) ou ont des paramètres estimés avec un grand écart.

Les données observées sont des éclairs d'un phare à 100 mètres de la ligne côtière (droite). L'angle est uniformément réparti, mais les éclairs observés le long de la côte sont à queue lourde.

  n_flashes <- 50loc <- c (0, 100) angles <- runif (n_flashes, -pi / 2, pi / 2) angles_x <- loc [2] * tan (angles) clignote <- loc [1] + angles_x

Je veux estimer l'emplacement du phare en fonction du processus de génération de modèle actuel à stan. Voici mon modèle stan:

  data {int<lower = 0> N; flashs réels [N];} paramètres {réel x_loc; real<lower = 0> y_loc; real<lower = -pi () / 2, supérieur = pi () / 2> angle [N];} modèle {x_loc ~ normal (0, 10); y_loc ~ normal (100, 10); pour (i dans 1: N) {clignote [i] ~ cauchy (x_loc + tan (angle [i]) * y_loc, 1); }}

(Note: je modélise l'observation flash avec un écart type de 1 mètre, car Stan me demande de donner une distribution pour les flashs [i]).

Ensuite, j'appelle le modèle de R:

  n_flashes <- 50loc <- c (0, 100) angles <- runif (n_flashes, -pi / 2, pi / 2) angles_x <- loc [2] * tan (angles) clignote <- loc [1] + angles_xstan_input <- list () stan_input $ clignote <- flashesstan_input $ N <- n_flasheskltstan "<- n_flasheskltstan" data = stan_input)

Mais ce modèle a de gros Rhat . Comment puis-je améliorer ce modèle pour éviter cela? Comment puis-je modéliser les angles en stan? Comment modéliseriez-vous l'emplacement d'un phare en vous basant sur les éclairs observés le long de la côte?

Pour ce problème la normale n'est pas adéquate, il faut modéliser les flashs avec un cauchy.Vérifiez D.S.Sivia - Data Analysis, A Bayesian Tutorial (2006), section 2.4.

Comme l'indique @jpneto, les flashs ont une distribution de Cauchy - qui n'a aucune attente et est donc une chose difficile à modéliser.Veuillez lire l'excellent article de Douglas Zare à http://stats.stackexchange.com/a/36037/919.Quelle que soit la manière dont vous estimez l'emplacement, cela devrait aboutir à une estimation très proche d'une position flash * médiane *.

Vous avez un `vecteur [N] flashes_` inutile introduit dans le bloc modèle, inutilisé dans la mesure où il n'y a aucune déclaration de probabilité associée.Ainsi, chaque composant de ce vecteur a un $ U (- \ infty, \ infty) $ postérieur incorrect.Le problème persiste-t-il après sa suppression?

Générer les données avec une distribution de Caucy et les modéliser avec une normale est le problème principal, mais votre probabilité peut simplement être écrite comme `flashes ~ cauchy (x_loc + tan (angle), 1);` si vous utilisez le dernier (R) Stan.Vous n'avez pas besoin de boucler et vous n'avez pas besoin de faire explicitement `angles ~ uniform (-pi () / 2, pi () / 2);` parce que cela est déjà impliqué par les contraintes dans la déclaration de paramètre.

Merci @JuhoKokkala,, c'était un reste des autres modèles que j'ai essayés.La suppression aide cependant.

@BenGoodrich pourquoi les flashs _conditionnels sur l'angle_ seraient-ils gaussiens?Dans le code de génération, les données sont une fonction déterministe de l'angle

Je préférerais quelque chose comme `flashes [i] = x_loc + tan (angle) * y_loc` dans le modèle Stan pour indiquer qu'il s'agit bien d'une fonction déterministe.

Vérifiez ceci: http://bayes.wustl.edu/sfg/why.pdf

J'ai essayé d'utiliser `flashes ~ cauchy (x_loc, y_loc);` et cela donne en fait le résultat parfait qui est une belle coïncidence :) Toujours têtu ici: y a-t-il un moyen de reproduire cela en utilisant une distribution uniforme sur les angles puis en transformantces angles (et emplacements) aux observations éclair?

model <- 'data {int<lower = 0> N; réel x_ [N]; } paramètres {alpha réel; real<lower = 0> beta; } modèle {alpha ~ uniforme (0, 20); beta ~ uniforme (0, 50); pour (k en 1: N) {x_ [k] ~ cauchy (alpha, bêta); }} '

alpha <- 10 # unknown true valuesbeta <- 30 ######### ######### set.seed (123) N <- 100theta_k <- runif (N, -pi / 2, pi / 2) x_k <- beta * tan (theta_k) + alphastan_input <- liste (x_ = x_k, N = N) fit <- stan (model_code = model, data = stan_input, iter = 1000, verbose = FALSE) fit2 <- stan (fit = fit, data = stan_input, iter = 5000, warmup = 2000, verbose = FALSE) print (fit2, pars = c ("alpha", "beta"))

Inférence pour le modèle Stan: 36eef3c3637fb3a9564529926f8463fe .4 chaînes, chacune avec iter = 5000; échauffement = 2000; mince = 1; tirages post-échauffement par chaîne = 3000, nombre total de tirages post-échauffement = 12000. moyenne se_mean sd 2,5% 25% 50% 75% 97,5% n_eff Rhatalpha 8,96 0,05 3,91 1,61 6,13 8,95 11,68 16,80 7079 1bêta 30,29 0,05 4,18 22,84 27,45 29,98 32,88 39,18 8470 1 Les échantillons ont été prélevés à l'aide de NUTS (diag_e) le mercredi 11 janvier 18:28: 57 2017.Pour chaque paramètre, n_eff est une mesure brute de la taille effective de l'échantillon et Rhat est le facteur de réduction d'échelle potentiel sur les chaînes fractionnées (à la convergence, Rhat = 1).