Alpha-Zero'nun oyununun, önceki bilgisayar satranç programlarından ziyade 'insan' olduğunu söyleyen bir grup kavgası üzerinde atlamak ve Alpha-Zero'nun oyununun tamamen “yabancı” olduğunu söylemek kolay. Alfa-sıfırın oyununun, özellikle insanlığa antropomorfizme olan eğilimi göz önüne alındığında, “daha insan” olduğu açık değildir.
İnsan Aklının Mücadelesi Olarak Satranç
Fakat satrançta bu eğilim doğru mu? Magnus Carlsen, bir keresinde genel olarak 'geleneksel' bilgisayarların insan yaratıcılığından nasıl yoksun olduğunu söyledi:
“Satranç, insan zihinleri arasındaki mücadeleyle ilgili. Heyecan verici kılan şey bu. Bilgisayar satranç mekanik, kuru ve yumuşak. Hareketler çok güçlü, elbette, ama stil yok. Bir satranç bilgisayarına karşı oynamayı denersen , sadece çok yüksek bir kesinlikte kaybedeceksiniz değil, aynı zamanda süreçte sıkılacaksınız.
Magnus Carlsen, geleneksel satranç bilgisayarlarında insan tarzı oyun kanıtı görmedi. Öyleyse, Alpha-Zero'nun son başarısının bu perspektifi geri alıp almadığını ve bizi kendimizi daha fazla hatırlatan bir şeye götürdüğünü inceleyelim.
Eğer 'insan-benzeri' ile kastediyorsanız, 'antropomorfizm anlayışımıza çekici gelebilecek bir davranış sergilemek' anlamına geliyorsa, Alfa-sıfır'ın tarzı daha insani görünüyor mu? Bu öznel miyopi insanları, insan olmayan şeyleri yansıtmayı gerçekten nasıl test ediyoruz? Haydi soralım: algoritması “seçici olarak daha iyi” seçiyor mu, yoksa oyun tarzında “daha insani yaratıcı bir seçim” sergiliyor mu?
Algoritmanın yaratıcıları stockfish aksine bir Alfa-Beta arama algoritmasını kullanan belirtmek Alpha-Zero ağırlıklı parametreler ~ önceki sonuçların elde inşa İçeride ISTV melerin RWMAIWi'nin girdi olarak kabul eden bir Monte-Carlo ağaç arama (MCTS) algoritması kullanır Sayfa 3. Mastering satranç ve Genel Takviye Öğrenme Algoritması ile Kendi Kendine Oynanarak Shogi ).
Bu yüzden algoritma hiç seçenek göstermiyor. Aslında, rastlantısal ama olasılıklı bir Monty-carlo araştırmasıyla meşgul olur, burada mümkün olan olası arama yolları önceki sonuçlara göre daha fazla önyargılıdır. Alpha-zero, oyun tarzını bu şekilde optimize etmeyi seçti mi, yoksa programcılarının seçimi miydi?
Alpha-zero, her zaman göz önünde bulundurulacak mümkün tüm hamlelere sahip midir, yoksa insanlar tarafından antropomorfik olarak yorumlanabilecek deneyimleri taklit edecek şekilde algoritmik olarak önyargılı bazı hareketler var mı?
Başlangıçta, onun için tüm hareketler mevcuttu, bu yüzden 'stili' tamamen rastlantısaldı. Bununla birlikte, araştırması gittikçe artan ve optimal olarak önceki başarı veya başarısızlıkla sınırlandırıldığından, stili aslında programcılarının uğraştığı moda doğru değişiyor. Bu 'daha insan' olsa da mı? Bunu daha yaratıcı olduklarından bazen daha az optimal hamle seçecek olan Magnus Carlesen ile karşılaştırın :
Magnus Carlsen: “Benzersiz bir şey yaratmayı takdir ediyorum”
(Yabancı) Aklın Mücadelesi Olarak Satranç
İnsanlar kendi oyun tarzlarını belirleyen kriterleri seçebilirler (örneğin kendi tarzımda sık sık dürtü ve hata seçtim). Her iki Satrançta Birçokları Alfa-Zero'nun oyun ve gidip kesinlikle olarak yabancı . MIT Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı'nda (CSAIL) yüksek lisans öğrencisi Nick Hynes şunları gözlemliyor:
“Burada gördüğümüz şey, insani önyargılardan ve önyargılardan arınmış bir model: Ne tespit ederse edin, optimal olanı öğrenebilir, bu da aslında aynı düşüncelerimizden daha farklı olabilir. Zaman yolculuğu gibi şeyler yapmasına izin veren kendi matematiğini icat eden yabancı bir medeniyet gibi… ”
Aynı şekilde GM Peter Heine Nielsen da Chess.com’a şunları söyledi :
“Gazeteyi okuduktan sonra, özellikle düşündüğüm oyunları gördükten sonra, her zaman üstün bir türün yeryüzüne inip bize nasıl satranç oynadıklarını göstermesinin nasıl olacağını merak ettim. Şimdi biliyorum.”
Görünüşe göre çoğu Alpha-zero'nun ortaya çıkan oyun tarzına “yabancı oyun” olarak değil, “daha insan” olarak tepki veriyor.
Bu nedenle, yukarıdaki cevaplara 'evet' diyenlere katılmamak için sebep var.