Elo derecelendirme sistemi neden yanlış güncelleme kuralı kullanıyor?


10

Elo derecelendirme sistemi, eşleştirilmiş karşılaştırmalarda beklenen ve gözlenen bir olasılık olasılığı arasında çapraz entropi kaybı fonksiyonunun gradyan iniş minimizasyon algoritmasını kullanır. Genel kayıp fonksiyonlarını şöyle yazabiliriz:

E=n,ipiLog(qi)

toplamı tüm sonuçları üzerinde gerçekleştirilir nerede ve tüm rakipler . ve olayın beklenen frekansı için gözlemlenen frekanstır.n p i i q iinpiiqi

Sadece iki olası sonuç (kazan ya da kaybet) ve bir rakibimiz varsa

E=pLog(q)(1p)Log(1q)

Eğer oyuncunun sıralaması ve oyuncunun sıralaması ise beklenen olasılığı sonra degrade iniş güncelleme kuralı kullanıma i π j j q i = e π iπiiπjj qj=e π j

qi=eπieπi+eπj
qj=eπjeπi+eπj

πi=πiη(qipi)

πj=πjη(qjpj)

burada ve , oyuncusunun oyuncusuna karşı beklenen ve gözlenen olasılıktır . Bu güncelleme kuralları.p i i jqipiijtwo outcomes

Çekilişlerin varlığında yukarıdaki modeli olasılıkla birlikte ve üçüncü sonucu genelleştirebiliriz

qi(w)=eπi

q(d)=νeπi+πj2eπi+eπj+νeπi+πj2
qj(w)=eπj
qi(w)=eπieπi+eπj+νeπi+πj2
qj(w)=eπjeπi+eπj+νeπi+πj2

Kayıp fonksiyonunu

E=p(w)Log(q(w))(1p(w)p(d))Log(q(l))p(d)Log(q(d))

burada sırası ile gözlenen olabilirlik , ve ve beklenen olabilirlik , ve . İkinci durumda güncelleme kuralıq ( w ) , q ( l ) , q ( d )p(w),p(l),p(d)winloosedrawq(w),q(l),q(d)winloosedraw

πi=πiη(qi(w)+qi(d)2pi(w)pi(d)2)

πj=πjη(qj(w)+qj(d)2pj(w)pj(d)2)

burada ve oyuncusunun kazanması ve oyuncusuna karşı beraberlik yapması için beklenen olasılıktır . Ve burada ve oyuncusunun kazanma ve oyuncusuna karşı çekme olasılığı gözlenir . Bu güncelleme kuralıdır.q j ( d ) i j p i ( w ) p i ( d ) i jqj(w)qj(d)ijpi(w)pi(d)ijthree outcome

Soru şu ki, Elo derecelendirme sistemi neden two outcomesçekilişler olsa bile güncelleme kurallarını kullanıyor ?

Yanıtlar:


3

Belirleyici bir sonuç elde etmek yerine çizim olasılığı Elo sisteminde belirtilmemiştir . Bunun yerine, hem beklenen performansta hem de maç sonucunda bir beraberlik dikkate alınır ve yarı galibiyet ve yarı zarar.

Wikipedia'da Elo sayfasından bir örnek : "Bir oyuncunun beklenen puanı kazanma olasılığı artı çizim olasılığının yarısıdır. Bu nedenle 0,75'lik beklenen bir puan% 75 kazanma şansını,% 25 kaybetme şansını ve% 0 şansını temsil edebilir Diğer uçta% 50 kazanma şansı,% 0 kaybetme şansı ve% 50 çizim şansı olabilir. "

two outcomeRA=RA+K(SAEA)SA=1(nw+0.5nd)+0(0.5nd+nl)SA=1SA=0.5SA=0

Elo gibi, Glicko sistemi de çekilişi modellemez, ancak bir kazancın ve kaybın (oyuncu başına) ortalaması olarak bir güncelleme yapar. Bunun yerine, TrueSkill sıralama sisteminde "çekilişler, belirli bir oyundaki performans farkının küçük olduğu varsayılarak modellenir. Bu nedenle, çizim şansı sadece iki oyuncunun oyun gücünün farkına bağlıdır. Ancak oyunda ampirik bulgular Satranç oyuncularının çekimleri profesyonel oyuncular arasında yeni başlayanlardan daha olasıdır. Bu nedenle, çizim şansı da beceri seviyesine bağlı görünüyor. "

Bu yaklaşım her oyun için farklı özel modelleme gerektirir (ve TrueSkill birkaç Microsoft Xbox oyununa uygulanır), bu nedenle Elo ve Glicko'da (sadece satranç için tasarlanmıştır) uygundur ve çok amaçlı sıralama sistemimiz rankade için değildir .


'Bir oyuncunun beklenen puanı kazanma olasılığı artı çizim olasılığının yarısıdır.' tam olarak yukarıdaki formülde bulduğum şeydir. Yine de Elo güncelleme formülünde, çizme olasılığının yarısı işaret ettiğiniz gibi belirtilmez. Soru hala var, neden Elo sıralama sisteminde çekilişleri umursamıyoruz?
emanuele

1
Beklenen puanı her zaman kazanma şansı ve kaybetme şansı olarak ifade edebilirsiniz (ve sıfır çizim şansı - Wikipedia'dan ilk örneğe bakın). Bu durumda, 'oyuncunun beklenen puanı kazanma olasılığıdır' (ve daha fazlası, çünkü yarı çizim olasılığı sıfırdır). Tek bir maçtan sonra, sonuç bir galibiyet veya kayıp ya da yarım galibiyettir. Beraberliklere izin verilen bir oyununuz olsa bile, Elo skorunu sadece bir galibiyet ve kayıp kombinasyonu kullanarak, berabere şansınız yokmuş gibi güncelleyebilirsiniz.
Tomaso Neri
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.