Herhangi bir saf strateji Nash dengesi, dolaylı olarak karma stratejiler Nash dengesidir. Değerlemeler değişkenlik gösterdiğinden, karışık stratejileri dikkate almak istediğimiz iyi bir göstergedir. Sorunun bize bunu anlatması, daha güçlü bir gösterge, ancak aradığınız aksiyomatik gerekçeden emin değilim. :-)
oyuncuyu düşünün . Bu oynatıcı ile 'in beklenen kar: , burada oyuncu teklifi, oyuncu teklif stratejisi ve oyuncu değerlemesidir. Biz varsayabiliriz (çünkü eğer , oyuncu adaylığına azaltarak bu geliştirebileceği). oyuncu için sadece iki potansiyel değer düşündüğümüz için, bazı sabitler için olduğunu varsayabiliriz.11E[Π1(b)]=(2−b)Pr[b≥β2(v2)]b1β22v22β2(0)=0β2(0)>022β2(v)=ava∈R++ . (Yani, iki nokta ve göz önüne alındığında, sadece aralarına bir çizgi çizeriz).(0,0)(2,β2(2))
Dikkate bu son eşitsizlik ile biz değerlemesi bir 50-50 şansı yana oyuncu .Pr[b≥av]=Pr[v≤ba]=b2a2
Şimdi bir Nash dengesi için, oyuncu beklenen değerini en üst düzeye çıkarmak istiyor. Bu, aşağıdaki optimizasyon sorunu ile verilir:1
maxb(2−b)⋅(b2a)
Bu, ilk sipariş koşullarını verir:
12a⋅(2−2b)=0 ve oyuncu için tek çözümümüz olduğunu öğrendik . Bu cevap oldukça sezgisel olmalıdır.b=11
Şimdi oyuncu yalnızca değerinin olması durumunda kazanır . Böylece oyuncu ve .22β2(2)=1β2(0)=0