Benimle tanıştığınız için şimdiden teşekkür ederim, hiçbir istatistikçi değilim ve hayal ettiğimi nasıl tanımlayacağımı bilmiyorum, bu yüzden Google bana burada yardım etmiyor ...
Üzerinde çalıştığım bir web uygulamasına derecelendirme sistemi ekliyorum. Her kullanıcı, her bir öğeyi tam olarak bir kez derecelendirebilir.
4 değeri olan bir ölçek hayal ediyordum: "kesinlikle beğenmeme", "beğenmeme", "beğenme" ve "kuvvetle beğenme" gibi ve bu değerleri sırasıyla -5, -2, +2 ve +5 olarak atamayı planlamıştım .
Şimdi, her öğe aynı sayıda oylamaya sahip olsaydı, bu puanlama sistemiyle en çok sevilen ve en az sevilen öğeleri açıkça farklılaştıracak kadar rahat olurdum. Ancak, öğeler aynı sayıda oylamaya sahip olmayacak ve farklı fotoğraflardaki oy sayısı arasındaki eşitsizlik oldukça dramatik olabilir.
Bu durumda, iki madde üzerindeki kümülatif puanların karşılaştırılması, çok vasat derecelendirmeye sahip eski bir öğenin, çok daha az oy alan olağanüstü yeni bir maddeden çok daha yüksek bir puana sahip olacağı anlamına gelir.
Yani, bir ortalama almamızı düşündüğüm ilk açık şey ... ama şimdi bir öğenin yalnızca bir "+5" derecesi varsa, 99 "+5" puanı olan bir maddeden daha iyi bir ortalamaya sahiptir. ve 1 "+2" derecelendirme. Sezgisel olarak bu, bir öğenin popülaritesinin doğru bir temsili değildir.
Bu sorunun yaygın olduğunu hayal ediyorum ve sizlere daha fazla örnekle belabor etmeme gerek yok, bu yüzden bu noktada duracağım ve gerekirse yorumlarda detaylandıracağım.
Sorularım:
- Bu tür bir sorun ne denir ve çözmek için kullanılan tekniklerin bir terimi var mı? Bunu bilmek istiyorum, böylece okuyabilirim.
- Konuyla ilgili herhangi bir lay dostu kaynak biliyorsanız, bir bağlantıyı çok takdir ediyorum.
- Son olarak, bu tür verilerin nasıl etkili bir şekilde toplanacağı ve analiz edileceği hakkında başka önerileri takdir ediyorum.