Bir olasılık modeline ihtiyacınız var.
Bir sıralama sisteminin arkasındaki fikir, tek bir sayının bir oyuncunun yeteneğini yeterince karakterize etmesidir. Bu sayıya "güç" diyebiliriz (çünkü "sıralama", istatistiklerde zaten belirli bir şey anlamına gelir). Kuvvet (A) gücü (B) aştığında A oyuncusu B oyuncusunu yenecektir. Ancak bu ifade çok zayıftır, çünkü (a) nicel değildir ve (b) zayıf bir oyuncunun zaman zaman daha güçlü bir oyuncuyu yenme olasılığını hesaba katmaz. A'nın B'yi yenmesinin sadece güçlü yanlarındaki farklılığa bağlı olma olasılığını varsayarak her iki sorunun da üstesinden gelebiliriz . Eğer öyleyse, o zaman tüm güçlü yönleri yeniden ifade edebiliriz, böylece güçlerdeki fark bir kazancın günlük oranlarına eşittir.
Özellikle, bu model
logit(Pr(A beats B))=λA−λB
burada, tanım gereği, günlük oranlarıdır ve A oyuncunun gücü için yazdım vb.logit(p)=log(p)−log(1−p)λA
Bu model, oyuncular kadar parametreye sahiptir (ancak daha az bir serbestlik derecesi vardır, çünkü yalnızca göreceli güçleri tanımlayabilir , bu nedenle parametrelerden birini rastgele bir değerde düzeltiriz). Bir çeşit genelleştirilmiş doğrusal modeldir (Binom ailesinde, logit bağlantılı).
Parametreler Maksimum Olabilirlik ile tahmin edilebilir . Aynı teori, parametre tahminleri etrafında güven aralıkları oluşturmak ve hipotezleri test etmek için bir araç sağlar (tahminlere göre en güçlü oyuncunun tahmin edilen en zayıf oyuncundan önemli ölçüde daha güçlü olup olmadığı gibi).
Özellikle, bir dizi oyunun ürünü
∏all gamesexp(λwinner−λloser)1+exp(λwinner−λloser).
birinin değerini sabitledikten sonra , diğerlerinin tahminleri bu olasılığı en üst düzeye çıkaran değerlerdir. Bu nedenle, tahminlerden herhangi birini değiştirmek olasılığı maksimumdan azaltır. Çok fazla azaltılırsa verilerle tutarlı değildir. Bu şekilde tüm parametreler için güven aralıkları bulabiliriz: bunlar, tahminlerin değiştirilmesinin log olasılığını aşırı derecede azaltmadığı sınırlardır. Genel hipotezler benzer şekilde test edilebilir: bir hipotez, güçlü yanları kısıtlar (hepsinin eşit olduğunu varsayarak), bu kısıtlama olasılığın ne kadar büyük olabileceğini sınırlar ve bu kısıtlı maksimum, gerçek maksimumun çok altına düşerse, hipotez reddedildi.λ
Bu özel problemde 18 oyun ve 7 ücretsiz parametre vardır. Genel olarak çok fazla parametre vardır: o kadar çok esneklik vardır ki, parametreler maksimum olasılığı çok fazla değiştirmeden oldukça serbestçe değiştirilebilir. Bu nedenle, ML makinelerinin uygulanması açık bir şekilde kanıtlanabilir, bu da güç tahminlerine güvenecek kadar yeterli veri olmadığı anlamına gelir.