Je calcule des tarifs, qui peuvent prendre n'importe quelle valeur entre 0 et 1. Peut-il être normalement distribué même si le domaine ne correspond pas aux nombres réels?
Merci beaucoup pour les réponses, ici je représente les moyennes des données sur lesquelles sont ajustées une distribution normale. J'ai créé quelque chose comme 1000 moyennes des données en utilisant le bootstrap.
Quant aux données brutes, elles sont en effet fortement biaisées avec une grande valeur d'asymétrie positive. Sur la base de vos réponses, la normalité du test t ne peut pas être supposée à 100%. Au lieu de tests t, j'essaie de calculer des intervalles de confiance. J'ai un intervalle de confiance pour la prédiction utilisant le bootstrap, même si je ne suis pas sûr à 100% que ce soit la bonne manière. Je compare 4 modèles prédictifs pour décider de ce qui donne les meilleurs résultats. Les taux individuels prévus sont regroupés par âge de la police et pris leur moyenne, les prévisions sont donc par exemple: pour l'âge = 4 le taux = 4,2%. Je veux utiliser une autre méthode pour l'IC, à savoir l'inégalité de Chebyshev. Mais pour cela, j'ai besoin d'adapter une distribution aux données. J'ai déjà essayé weibull, beta, gamma mais aucun d'entre eux ne semble fonctionner.
EDIT: Le modèle que j'ai créé prédit les taux individuels et je prends la moyenne de ces taux pour obtenir le taux moyen pour un groupe. Cette moyenne doit être estimée correctement, un IC lui est également attribué. J'ai pensé que si j'effectuais un test t sur chaque groupe entre les prédictions du modèle et les valeurs réelles à prédire (jeu de données de test) et que j'obtenais des valeurs p non significatives, alors le modèle était bon. J'avais besoin de ces informations concernant la normalité possible des valeurs à cause du test t.
Merci beaucoup pour toutes les informations que vous m'avez données jusqu'à présent! Vous êtes génial!