Oyun teorisini kullanarak bir araştırma konusu seçme


19

Bu son oyun teorisi sorusu beni düşündürdü (elbette bu bir teğet): Oyun teorisini kullanmak için araştırma sorularını seçmek için kişisel bir stratejiyi verimli bir şekilde optimize etmek mümkün mü?

Sorunun resmileştirilmesine yönelmek için aşağıdaki (gayri resmi olarak belirtilen) varsayımları yapacağım:

  • Eşit şekilde çalışabileceğim herhangi bir problemi "beğeniyorum" ("İstediğinizi yapın!" Sorusunun "yumuşak" (ve doğru!) Cevabını önlemek için).
  • Üzerinde çalışmayı seçtiğim herhangi bir soruna cevap bulma konusunda başarılı olabilirim veya olmayabilirim. Herhangi bir sorun için, bir problemi çözmede ne kadar iyi olacağımı tahmin ediyorum (zamana yatırım yaptıktan sonra).
  • Amacım, ne kadar problem çözdüğümün ve problemlerin ne kadar önemli veya zor olduğunun bir fonksiyonu olan, işten başvurmak, iş başvurusu yapmak, görev süresi için başvurmak, burs başvurusu yapmak vb. . Sorun başına kesin getiriler hakkında net bir fikrim yok, ancak makul bir tahmin yapabilirim.
  • Problem getirisi ile problem zorluğu arasında ters bir ilişki vardır. Amacımın bir başka ifadesi de farklılıkları "oyunlamak" (yani "düşük meyveli meyveleri aramak").
  • Bu genel sorunun bir örneği, sıkıca eklediğim (hesaplama maliyeti olmadan; girdi olarak verilir) bir araştırma soruları listesi (soru olarak) ve sorunun zorluk derecesi ile belirtilir. Bu oyunu bir düşmana karşı oynuyorum (beni değerlendiren kişi); Belirli bir problemi çözme olasılığım göz önüne alındığında, denemeyi seçtikten sonra başarılı bir şekilde çözüp çözemeyeceğime doğa karar verir.

Neler olup bittiğini gerçekten resmileştirmek (ve ilgisiz veya tartışmacı / tartışma tipi yanıtları yan yana koymak) için, bu sorunu sonsuz bir eylem setiyle eksik bilgi içeren kapsamlı bir oyun olarak göreceğim .


Soru : Bu tür oyunların verimli bir şekilde hesaplanamayacağını düşünüyorum. Ancak, getirimi yaklaşık en üst düzeye çıkarmak için bir polinom zaman algoritması var mı? PTAS ne olacak?

Ya da alternatif olarak, bu sorun için daha doğru bir oyun teorik modeli var mı? Öyleyse, aynı soru şu: Ödememi verimli bir şekilde maksimize edebilir miyim (yaklaşık olarak)? Öyleyse nasıl?


4
Bunu bir oyun olarak formüle etmenin potansiyel bir problemi, rakibinizin, sizi değerlendiren kişinin size karşı oynamak zorunda olmamasıdır. Gerçekten de sizin tarafınızdaylar ve sadece asgari gereklilikleri geçmediyseniz başarısız olduğunuzu görmeye istekli olurlar. Diğer olası araştırmacılar da , diğer tüm araştırmacılardır , çünkü aynı problem üzerinde çalışıyor olabilirler (muhtemelen işbirliği içinde) ve böylece sizden önce sonuçları elde etmeye çalışarak başarıya ulaşmak için size karşı çalışmaktadırlar.
Dave Clarke

Bu sorunun amaçları için (mümkün olduğunca fazla tartışmayı reddetmek istiyorum, bu yüzden bu iyi bir soru ...), diyelim ki beni değerlendiren kişi gerçekten ve sadece en iyi tek bir kişiyi seçmek için ciddi bir baskı altında belirli bir ödül, yani onlar düşmanca. Ayrıca, "gerçekten orijinal olan herhangi bir şeyin sadece bu olacağı olduğunu varsayalım", yani diğer araştırmacılar ciddi bir endişe kaynağı değildir. Ben şahsen başka olasılıklarla ilgileniyorum, ama açık bırakmanın kötü cevaplar vereceğini düşünüyorum. :)
Daniel Apon

Problemde farklı bir modeli hak edebilecek faktörlerden biri: Üzerinde çalışmayı seçtiğim problem başına başarı / ödül yapısının olasılığının değerlendirilmesi.
Daniel Apon

2
R,TrbenPben(t)t

2
Tabii ki, gerçek hayatta, cevapladığınız her soru, önceden tahmin edemeyeceğiniz, ancak başladığınız soru setinden daha kolay ve / veya daha değerli olan daha fazla sorunun kilidini açar, ancak bir kez strateji ağaçları yapmaya başladığınızda bunun gibi oyun hakkında söyleyebileceğiniz ilginç bir şey bulma şansı önemli ölçüde azalır.
Peter Shor

Yanıtlar:


4

Soruya alternatif bir model önererek size soruyu cevaplamaya çalışacağım. Genelde burada cevapladığımdan daha fazla soru soruyorum, bu yüzden umarım cevabım en uygun değilse affedersiniz, ancak elimden gelenin en iyisini yapıyorum.

Oyun teorisinin faydalı olmasını sağlamak için en uygun soruyu ifade etmenin yolunun daha rekabetçi bir senaryo oluşturmak olduğunu düşünüyorum. Yani, çeşitli farklı aktörler arasında rekabet olması gerekir. Yani, aşağıdakileri varsayacağım:

  • Büyük ancak sonlu sayıda bulunmaktadır n dediğim mevcut araştırma soruları, aynı seti sürdürmeye çalışırken, diğer araştırmacıların Q Eğer ilgilenen olduğunu,.
  • Her araştırma problemi aşağıdaki özelliklerle tanımlanır:
    • Sorunu çözüp çözemeyeceğiniz konusunda görünürlük elde etmek için gereken zaman yatırımı veya ben
    • Sorunu çözmede başarı olasılığı veya S ; "hakikat anına" ulaştığınızda ve yeterince zaman harcadığınızda, doğa sorunu çözüp çözemeyeceğinize rastgele karar verecektir.
    • Başarıya ulaşılması koşuluyla kariyerinize veya U'ya ( faydada olduğu gibi) fayda sağlayın
  • Bu araştırmacıların her birinin aşağıdaki miktarlarda farklı seviyeleri vardır:
    • Araştırmaya yatırım için uygun zaman, t
    • Araştırmada yetenek, r
    • Kişilerarası beceriler ve diğer kariyer yardımcı nitelikleri, l (mümkün olduğu gibi), araştırmacının kariyer ilerlemeleri için araştırma başarılarından ne kadar iyi yararlanacağını belirleyecektir.

Şimdi, herhangi bir problem üzerinde hiçbir işbirliğinin mümkün olmadığını varsayarak, "dinamik yinelenen oyun" olarak anlatacağım şeyi düşünün. Bu, tekrar tekrar oynanan bir oyundur, ancak her oynandığında biraz değişir.

M , oyundaki hamle veya dönüş sayısı olsun . Oyunun ilk tezahürü, her bir aktörün ve yukarıda listelediğim her sorunun yanı sıra, tüm aktörleri (araştırmacı) ve üzerinde çalışabilecekleri her sorunu içeren bir liste olarak temsil edilebilir. (Elbette, her araştırmacının şu anda tüm problemler ve diğer tüm araştırmacılar hakkında bilinen her şeyi bildiğini ve bunu mükemmel bir bilgi oyunu haline getirdiğini varsayıyorum.)

Oyunun her bir yinelemesi sırasında, belirli bir oyuncu üzerinde çalışmak için bir araştırma sorusu seçer. Her aktörün istediği zaman soru değiştirmesine izin verilir ve bir sorun çözülürse, U kariyerine olan fayda diğer tüm oyuncular için 0'a düşer. Bir oyuncu yeterli zaman ayırır ve sorunu çözemezse, o oyuncunun bu sorunu tekrar çözmeye çalışmasına izin verilmez ... ancak başka bir oyuncunun sorun üzerinde çalışmaya devam etmesine izin verilir ve başka bir aktör çözebilir başarıyla. Tüm M dönüşleri yapıldıktan sonra oyun sona erer .

Bir araştırmacının bir problem seçtiği her tur, oyuncunun "gerçek anına" yaklaşmasına ve muhtemelen problemi çözmesine, Doğa izin vermesine neden olacaktır. Bir problem çözüldüğünde, araştırmacının kariyerine l . Araştırma yeteneği başarı olasılığını arttırırken, serbest zaman belirli bir sırada ilerleme kaydetme yeteneğini arttırır.

Bunu çözmek için herhangi bir polinom zaman algoritması olduğundan şüpheliyim; Araştırmacıların saf strateji Nash dengesini oynamakla sınırlandırılmaları için hiçbir neden görmüyorum, bu yüzden problem bir karma strateji Nash dengesini içerecek ve bir Nash bulmak için "problemi çözmek" demek istiyorsanız, en kötü PPAD-tamamlanmış olacak. sorun için denge. " (Etrafınızdaki en proaktif araştırmacı iseniz, devam edip en sevdiğiniz Nash dengesini hesaplayabilir ve daha sonra diğer tüm oyunculara sinyal verebilirsiniz ... böylece kimsenin stratejiden uzak stratejileri değiştirmeyeceğine dair güven verin. işaretlediğiniz profil.)

Her halükarda, bu şimdiye kadar yayınladığım en ilgili cevap. Umarım en azından bir değeri vardır. Lütfen herhangi bir yanıtın olup olmadığını veya yanıtını veya iyileştirilmesi için önerileri bildirin.


1
Philip, cevap için teşekkürler! Bu soruna büyük bir bakış açısı; Acaba: Soruna "kısmi bilgi" nosyonu eklemenin herhangi bir yolunu düşünebilir misiniz, böylece PPAD-tamlık durumunu koruyabilir mi? Bu oyunda bir oyuncu olarak, tüm düşmanlarımın ne yaptığını bilmiyorum (yani hangi soruları düşündükleri ve hangi güce sahip olduklarına inandıkları konusunda mükemmel bir bilgim yok. her soruya cevap)? Bunu eklemek bir Nash Dengesini hesaplamanın karmaşıklığını etkiler mi? (Bilmiyorum!)
Daniel Apon

1
@Daniel Apon: Yorum için teşekkürler! Koşulları değiştirmenin zor olacağını düşünmüyorum, böylece rakiplerinizin ne yaptığını ya da özelliklerinin ne olduğunu bilmiyorsunuz. Tek uyarı, bir Nash dengesinin varlığının garantisinin, kusurlu bir bilgi oyunu ile uğraşırken ortadan kalktığını düşünüyorum. "Stackelberg oyunları" olarak bilinen şey hakkında pek bir şey bilmiyorum, ancak önerilen değişikliklerinizle alakalı olabileceğini düşünüyorum. Aslında eksik bilgi oyunlarında en iyi çözüm kavramının ne olduğunu merak ettim ... Bunu biraz düşüneceğim.
Philip White

Bu konuda biraz daha okudum ... Bayesian oyunlarının burada alakalı olabileceğini düşünüyorum, çünkü kusurlu bilgilerle oyunlarla uğraşmak için kullanılıyorlar. İşte baktığım
Philip White
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.