Satranç uzmanları neden AlphaZero'nun Stockish'e karşı kazandığı zafer karşısında şaşırdılar?


10

Bu oldu son zamanlarda dikkatimi çekti satranç uzmanları bir yığılmanın şey olarak bu şimdi ünlü maçın sonucunu aldı.

Bakınız: Satranç'ın En İyi Yeni Oyuncusu Korkusuz, Palavracı Bir Algoritma

Chess ve Chess AI konusunda uzman olmayan biri olarak, AlphaGo'nun performansına ve kombine oyunlarla ilgili olarak bu tür bir yöntemin onaylanmasına dayanarak eski AI'nın hiç şansı olmayacağı varsayımdı.

  • AlphaZero'nun zaferi neden şaşırtıcıydı?

Yanıtlar:


14

İyi soru.

Birincisi ve en önemlisi Go'da derin insanın meydan okuyacak hiçbir insanüstü rakibi olmamasıydı. Go motorları, en iyi insan oyuncuların en üst seviyesine yakın bir yerde değildi. Ancak satrançta, motorlar en iyi insan oyunculardan 500 ELO puanı daha güçlüdür. Bu büyük bir fark. Çağdaş satranç motorlarına giren iş miktarı şaşırtıcı. Programlamada milyonlarca saatten, yüz binlerce tekrardan bahsediyoruz. Büyük bir bilgi ve çalışma organıdır. Bunların üstesinden gelmek ve 4 saat içinde aşmak şaşırtıcı.

İkincisi, satranç ustaları için şaşırtıcı olan sonucun kendisi değil, AlphaZero'nun nasıl satranç oynadığıdır. İnsan bilgisi veya uzmanlığı olmayan bir sistemin bizim yaptığımız gibi oynaması oldukça ironiktir. Motorlar çirkin görünümlü hamleler, uyumsuz olanlar vb. AlphaZero hiç böyle oynamaz. Rakibin taşlarına derin stratejik oyun ve çarpıcı konum fedakarlıklarıyla hükmettiği çok insan benzeri bir tarza sahiptir. AlphaZero, derin konumsal anlayışı bir motor hesaplamasının hassasiyeti ile birleştirerek istediğimiz yolu oynar.

Düzenle Oh ve ben sonucun kendisi hakkında bir şeyden bahsetmeyi unuttum. Bilgisayar satrancı hakkında bilgi sahibi değilseniz, şaşırtıcı görünmeyebilir, ancak öyle.

Günümüzde en modern motorları birbirinden ayıran zafer marjları çok ince. 100 maçta daha iyi motoru belirlemek için 85 oyun, 9 zafer ve 6 kayıp gibi bir sonuç görmeyi bekleyebilirsiniz.

AlphaZero 28 kazanır ve sıfır kayıpla 72 beraberlik, dünya çapında eziciydi ve gerçekleştiği ana kadar tamamen düşünülemezdi.


Güzel cevap. Yapay Zeka'nın satranç ile karşılaştırılması hakkındaki görüşünüz, Satranç'ın döngüselliğine ve Kazanç / Kayıp / Beraberlik triadına dayanan sınırlama açısından ilginçtir. (Muhtemelen, gelecekte, sonuçlar açısından daha ayrıntılı bir analiz yapılmasına izin veren sonlu, inatçı oyunlara ihtiyacımız olacak.) Satranç motorlarının tarihine ve bunlara giren büyük miktarda çaba ve insan bilgisine aşinayım, ancak başarı eksikliği bağlamında yeniden: çok daha karmaşık 19x19 Go'nun bana ters bir etkisi oldu.
DukeZhou

Özellikle, benim varsayım, AlphaGo'nun çok daha karmaşık bir oyunda en iyi insanları yenebilmesi durumunda, sadece en iyi insanları değil, diğer herhangi bir oyunda önceki en iyi AI'ları yenmesi makul görünüyordu.
DukeZhou

Yapay hareketlerle ilgili biraz önemli ve satranç dışı oyuncuların bahsettiğini gördüğüm bir şey değil. +1
Stella Biderman

4

Satranç için MCTS literatürde çok az başarı ile denenmiştir. AlphaGo'nun yaklaşımının asla satrançta, belki Go'da değil, satrançta işe yaramayacağı varsayıldı . Aniden, Google yaklaşımın işe yaradığını ve dünyanın en güçlü satranç programını çok önemli bir farkla yendiğini duyurdu.

Google'dan önce, tüm satranç programcılarına motor programlamada buluşsal yöntemler oluşturma öğretildi, makine öğreniminden daha iyi bir stratejiydi. Sinir ağlarını nasıl uygularsanız uygulansın, bir sürü 64 bit bitboard talimatından daha hızlı koşmazdı. AlphaGo oldukça yavaş koşuyordu , ancak en güçlü satranç oynadı.


2

Sağladığınız makalelere dayanarak zaferde birçok sürpriz görüyorum:

Satranç ustalaşması zor bir oyun ve karşı kısmı dünyanın en iyi uygulamalarına sahipti, AlphaZero'nun tabula rasa vardı.

Öğrenme dört saat sürdü ve AlphaZero 100 maç kaybetmedi.

Oyun tarzı insanın ve bilgisayarın hareketler, agresif ve bazen de hiçbir fikri olmayan ama aslında gelecekteki durumu daha güçlü kılan fedakarlıklarla aptal gibi görünen yabancı bir karışımdı.

Her hareket için dikkate alınan olasılıkların sayısı karşı kısımdan daha azdı, AlphaZero'nun gizemli bir bağırsak hissi veya sezgisi vardı.

Üzüntü hissi, AlphaZero'nun kendisi ile oluşturduğu eğitim materyali miktarından ve geleneksel makineye adil bir süre vermeyen zaman sınırından geldi.


Aaah. Bu yüzden yeni AI yöntemine olan güven eksikliğinden kaynaklandı. Mantıklı.
DukeZhou
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.