Noter des éléments qui ne sont pas facilement comparés

M. Cypher

2013-02-22 21:50:39 UTC

view on stackexchange narkive permalink

Tout d'abord, je m'excuse car cette question a probablement été posée plusieurs fois et sa réponse est facile. Cependant, en tant qu'amateur de statistiques, je ne pouvais tout simplement pas comprendre quels mots-clés étaient pertinents pour ma question.

Supposons que vous ayez 100 marchands et 100 produits. Chaque commerçant vend une certaine gamme de produits, allant d'un seul produit aux 100 produits. En outre, les produits sont vendus dans des proportions très différentes, qui diffèrent selon les commerçants, et sont soumis aux préférences individuelles (irrationnelles) du commerçant.

Chaque fois qu'un commerçant fait un "pitch" sur le marché, nous observons si ou non il parvient à vendre le produit qu'il lance. Nous supposons que la probabilité de succès dépend (a) de la compétence du commerçant et (b) de l'attractivité du produit. Les prix des produits sont fixes, ce n'est donc pas un facteur.

Les données dont nous disposons se composent de millions d'emplacements. Pour chaque argumentaire, nous savons s'il a réussi ou non, le marchand et le produit.

Évidemment, si nous comparons les marchands par leur taux de réussite moyen, cette information est inutile car chaque marchand vend des produits différents. De même, si nous comparons les produits, nous n'obtenons aucune information puisque chaque produit est vendu par différents marchands.

Ce que nous voulons, c'est un score de compétence pour chaque marchand, qui est indépendant des produits que le marchand est vente, et un score d'attractivité pour chaque produit, qui est indépendant des marchands qui le vendent.

Je n'ai pas besoin d'une explication complète, juste quelques mots-clés pour m'indiquer le bon direction. Je n'ai littéralement aucune idée par où commencer.

Modifier: notez que notre hypothèse est que l'attractivité du produit est indépendante du marchand et que la compétence du marchand est indépendante du produit, c'est-à-dire qu'il n'y a pas de marchands qui vendent mieux certains produits mais pire pour en vendre d'autres.

Cela relève-t-il de l'apprentissage non supervisé? Nous avons un effet combiné (0/1) des compétences du marchand et du score du produit (les deux ordinal disent 1-100), et nous n'observons pas (et n'avons aucune idée) de l'ordre des 2 prédicteurs.

Vous voudrez peut-être consulter "** Analyse conjointe **"

Bienvenue à CV, @user21509. Souhaitez-vous développer votre réponse? Pourquoi l'analyse conjointe serait-elle utile ici? Notez que CV n'est pas simplement un site de questions-réponses, mais cherche à créer un référentiel permanent d'informations statistiques.