Nash denge hesaplaması için algoritmalar.


10

Daha önce sorulup sorulmadığını görmek için forumu araştırdım ve algoritmik oyun teorisi tartışılırken bu özel konuyu ele alamadım. Sonlu bir n-kişilik oyunda yaklaşık (karışık strateji) Nash dengesini hesaplamak için en iyi bilinen algoritmanın ne olduğunu anlamaya çalışıyorum. Tabii ki, bu algoritma PPAD olacaktır. Hız / verimlilik ile algoritmanın kusursuz doğruluğundan daha çok ilgileniyorum.

Teşekkürler Philip


Daha fazla ayrıntı verirseniz size daha iyi yardımcı olabiliriz. Örneğin aklınızda hangi değeri var? Akılda ödeme fonksiyonunun özel bir yapısı var mı? Gerçekten bir Nash dengesine ihtiyacınız var mı yoksa ilişkili bir denge yeterli mi? İyi kanıtlanabilir sınırlara veya iyi pratik performansa sahip bir şey mi arıyorsunuz? n
Warren Schudy

Yanıtlar:


7

Kısa cevap, yaklaşık Nash dengesini kanıtlamak için bazı polinom zaman algoritmaları olmasına rağmen, hepsinin nispeten zayıf yaklaşımlar bulmasıdır - muhtemelen bir oyun oynamak için bir algoritma bulmaya çalışıyorsanız muhtemelen yeterince iyi değildir. 2 oyuncu oyunları için n oyuncu oyunlarından daha fazlası bilinmektedir.

Yapmaya çalıştığınız şey aslında (yaklaşık) bir Nash dengesi bulmaksa, deneyebileceğiniz kolay bir şey, oyun oynamayı simüle etmektir, her oyuncu rasgele ağırlıklı çoğunluk algoritmasını kullanır (http://en.wikipedia.org/ wiki / Randomized_weighted_majority_algorithm). Bu çalışacağı garanti edilmez, ancak birçok durumda olacaktır (Ve sıfır toplamlı oyunlar gibi belirli oyun sınıflarında garanti edilir). Özellikle, bu işlem hiç yakınsa, bir Nash dengesine yakınsaması garanti edilir. Tehlike, birleşmeyecek ve sonsuza dek dönmeyecek - ancak bu durumda bile, oyunun ampirik tarihi, kaba ilişkili denge setine yakınlaşacaktır.


Yukarıdaki cevapta belirtilen makaleye bakmaya başladım. Hepsini (ya da ilk bakışta çoğunu) anlamadım ... Yaklaşmanın neden "nispeten zayıf" olduğunu açıklayabilir misiniz? Ayrıca kısaca “kaba korelasyonlu dengenin” ne olduğunu kısaca anlatabilir misiniz? İlişkili bir dengenin ne olduğunu biliyorum, ama böyle bir denklem için ne anlama geliyor. kaba olmak. Son olarak, "oyunun ampirik tarihi birleşecek ... [vs.]" İle ne demek istiyorsun? Asla yakınsamayan bir şey bir dizi CCE'ye nasıl yaklaşabilir? Cevabınız için teşekkürler, şimdi Wikipedia makalesine bakıyorum.
Philip White

Kaba korelasyonlu dengeye veya korelasyonlu dengeye yakınlaşan dağılımlar üreten algoritmalar hakkında bazı bilgiler için, buradan başlıyorum: cs.cmu.edu/~avrim/Papers/regret-chapter.pdf
Aaron Roth

Eğer kaba korelasyonlu bir denge yerine korelasyonlu bir denge istiyorsanız iç pişmanlık duymayan bir öğrenci kullanabilirsiniz. Örneğin (utanmaz fiş) cs.brown.edu/~ws/papers/regret.pdf . İlişkili dengeleri doğrudan polinom zamanında hesaplamak için algoritmalar da vardır.
Warren Schudy


4

Aslında yazılımda uygulanan algoritmalar ile ilgileniyorsanız, bildiğim birkaç tane var:

  1. GAMBIT paketi (http://www.gambit-project.org/doc/index.html), 2 oyunculu ve n oyunculu normal form ve bazı durumlarda kapsamlı form oyunları için birkaç Nash denge algoritması uygular.

  2. GameTracer (http://dags.stanford.edu/Games/gametracer.html), n oyuncu normal form oyunları için Govindan ve Wilson'un GNM ve IPA algoritmalarını uygular.

  3. Büyük oyunlar için, oyuncuların sayısında katlanarak büyüdüğü için normal form gösterimi problemlidir. Bunun yerine, oyununuzun faydalı işlevinin belirli tür yapıları varsa, çok daha az yer kullanarak ifade etmek için "özlü gösterim" (örn. Grafik oyunlar, simetrik oyunlar, aksiyon-grafik oyunları) kullanabilirsiniz; ve ayrıca yapı, hesaplama hızlandırmaları için sıklıkla kullanılabilir. Yazılım açısından, AGG Çözücü (http://agg.cs.ubc.ca) GameTracer'ın GNM algoritmasını ve GAMBIT'in simpdiv algoritmasını aksiyon-grafik oyunu (AGG) temsiline uyarlar. (Feragatname: Bu yazılımın pacakge geliştirilmesine katılıyorum.)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.