Karl Broman'ın cevabında söylediği gibi, Bayesçi bir yaklaşım muhtemelen güven aralıklarını kullanmaktan çok daha iyi olurdu.
Güven Aralıkları ile İlgili Sorun
Güven aralıklarını kullanmak neden çok iyi çalışmıyor? Bunun bir nedeni, bir öğe için çok fazla puana sahip değilseniz, güven aralığınızın çok geniş olacağı, böylece güven aralığının alt sınırının küçük olacağıdır. Bu nedenle, çok sayıda derecelendirme içermeyen öğeler listenizin en altında yer alır.
Sezgisel, ancak, muhtemelen tüm öğeleri (yani, bir doğru tahmini notunu itmek istiyor üzerinde ortalama puanı etkiler öğenin tahmini notunu kıpırdatmak istediğim çok değerlendirmesi olmadan ürün, ortalama öğeye yakın olmak istiyorum öncesinde ) . Bu tam olarak bir Bayesian yaklaşımının yaptığı şeydir.
Bayes Yaklaşımı I: Derecelendirme Üzerine Normal Dağılım
Tahmini reytingi bir öncekine kaydırmanın bir yolu, Karl'ın cevabında olduğu gibi, formunun bir tahminini kullanmaktır :W * R + ( 1 - a ) * Cı
- R, , maddelere ilişkin derecelendirmelerin ortalamasıdır.
- C , tüm öğelerin üzerindeki ortalamadır (veya puanınızı düşürmek istediğiniz önceki durum).
- Formülün sadece ve ağırlıklı bir kombinasyon olduğunu unutmayın .Cı-R,C
- Rvmw = vv + m , atanan ağırlıktır , , bira için yorumların sayısıdır ve , bir tür sabit "eşik" parametresidir.R,vm
- Not o zaman biz şimdiki öğe için değerlendirmesi çok şey var olduğunda, yani, o zaman, çok büyük bizim tahmin derece çok yakın olduğunu, bu yüzden çok yakın 1'e olan ve biz önce pek dikkat . , küçük olduğunda , , 0'a çok yakındır, bu nedenle, tahmini derecelendirme, önceki çok fazla ağırlık koymaktadır .w R C v w CvwR,CvwC
Aslında bu tahminde, bireysel puanlamalar bu ortalama etrafında merkezlenmiş normal bir dağılımdan geldiğinde, maddenin ortalama puanının arka tahmini olarak Bayesci bir yorum yapılabilir .
Bununla birlikte, derecelendirmelerin normal bir dağılımdan geldiğini varsayarsak, iki sorun vardır:
- Normal bir dağılım süreklidir , ancak derecelendirmeler ayrıktır .
- Bir öğeye ilişkin derecelendirmeler, her zaman, tek tip bir Gauss şeklini takip etmiyor. Örneğin, belki de eşyanız kutuplaşıyor, bu yüzden insanlar ya çok yüksek bir derecelendirme verme ya da çok düşük bir derecelendirme verme eğilimindedir.
Bayes Yaklaşımı II: Derecelendirmelere Göre Çok Sıralı Dağılım
Bu yüzden derecelendirmeler için normal bir dağılım varsaymak yerine, bir multinom dağılımını farz edelim . Olduğunu, bazı özel madde göz önüne alındığında, bir olasılık var rastgele kullanıcı 1 yıldız, bir olasılık vereceğini rastgele kullanıcı o yüzden 2 yıldızları ve vereceğini.p 2p1p2
Elbette bu olasılıkların ne olduğu hakkında hiçbir fikrimiz yok. Bu öğe için gittikçe daha fazla derecelendirme elde , yakın olduğunu , burada , 1 yıldız veren kullanıcı sayısı ve , puan alan toplam kullanıcı sayısıdır Öğe, ama ilk başladığımızda hiçbir şeyimiz yok. Bu yüzden bu olasılıklar üzerine bir Dirichlet'in önce .n 1p1 n1nDir(α1,…,αk)n1nn1n D i r ( α)1, … , Αk)
Bu Dirichlet'in önceki adı nedir? Her bir parametresinin, bazı sanal kişilerin yıldıza verdiği öğelerin kaç kez "sanal sayım" olduğunu düşünebiliriz . Örneğin, , ve diğer tüm eşitse, iki sanal öğenin 1 yıldıza verdiğini ve bir sanal kişinin 2. öğeye verdiğini söyleyerek bunu düşünebiliriz. yıldızlar. Dolayısıyla, gerçek kullanıcıları bile almadan önce, bu sanal dağıtımı, öğenin derecelendirmesini tahmin etmek için kullanabiliriz. i α 1 = 2 α 2 = 1 α iαbenbenα1=2α2=1αi
[ parametrelerini seçmenin bir yolu , yıldızlarının oy oranına eşit değerini ayarlamaktır . ( parametrelerinin mutlaka tamsayı olmadığına dikkat edin.)]α i i α iαiαiiαi
Ardından, gerçek derecelendirmeler girdikten sonra, sayıları Dirichlet'inizin sanal sayımlarına ekleyin. Öğenizin derecesini tahmin etmek istediğinizde, yalnızca öğenin derecelendirmelerinin (hem sanal derecelendirmelerin hem de gerçek derecelendirmelerin) ortalamasını alın.