'Eugene Goostman' Turing sınavını gerçekten geçti mi?


18

13 yaşındaki bir çocuğu simüle etmek için geliştirilen bir bilgisayar programı olan 'Eugene Goostman'ın yargıçların yüzde 33'ünü insan olduğuna ikna etmeyi başardığı ve böylece Turing Testini geçtiği söyleniyor.

Bir chatbot olarak adlandırılan bilgisayar programı, İngilizce'nin ikinci dil olduğu 13 yaşında bir Ukraynalı çocuk gibi davranıyordu - gerçekten çok farklı bir şey.

Benim için, Eugene tıpkı vasat bir chatbotun yapması gerektiği gibi geliyor: tekrarlayan, saçma ve sıralı olmayanlarla doluydu. (Profesyonel olmayan) yargıçları nasıl ikna ettiğini bilmiyorum.

Birçok insan, Eugene'yi "Bu saçmalık" ve "Turing testini geçmedik. Yakın bile değiliz" diyen Prof Stevan Harnad gibi eleştirdi.

Görüşler farklı, ama gerçekten resmi olarak testi geçip geçmediğini bilmek istiyorum?

Ayrıca şu söylenir:

Daha önce hiç verilmemiş iki kerelik ödüller. 25K, yargıçların gerçek bir insandan ayırt edemediği ve yargıçları insanın bilgisayar programı olduğuna ikna edebilen ilk chatbotbot için sunulmaktadır. 100.000 dolar, yargıçların metin, görsel ve işitsel girdileri deşifre etmeyi ve anlamayı içeren bir Turing testinde gerçek bir insandan ayırt edemediği ilk sohbet botunun ödülüdür. Bu gerçekleştiğinde, yıllık rekabet sona erecektir.

Bu Eugene'nin 25.000 dolar kazandığı anlamına mı geliyor?


2
Hâkimlerin bu durumda olduklarını bilmeleri çok önemlidir.
Thorbjørn Ravn Andersen

3
Yargıçların 2 / 3'ü bu botun insan olmadığını düşünüyor. Bana göre bu etkileşimin yapay doğası hâkimlerin çoğunluğundan daha fazla belli oldu. Buna açık bir başarısızlık derdim. (Ve "Eugene" "kazanmış olsa bile - yapay bir insan gerçek parayı nasıl toplar? BitCoin? :-)
Bob Jarvis - Monica'yı

Örnek bir konuşma sağlayabilir misiniz? Ukraynalılarla günlük olarak etkileşime giriyorum ve İngilizce konuşma biçimleri kolayca tanınabilir.
Stephan Bijzitter

Yanıtlar:


18

"Resmi Turing testi" yoktur, bu nedenle "testi resmi olarak geçmek" kavramı yoktur. Turing, yapay zekâları değerlendirmek için kullanılabilecek bir metodoloji tanımladı. Eugene Goostman'ın kazandığı etkinliğin organizatörleri bu metodolojiyi belirli bir şekilde uyguladılar ve program organizatörlerin seçtiği kriterleri karşıladı. Bu anlamda testi geçti.

"Resmi Turing testi" olmadığından, Eugene Goostman'ın bir Turing testinden, hatta Turing tarzı bir testten geçtiğini söylemek daha uygun olabilir . Bu medya özellikle Turing'in ün ve "fikrini göz önüne alındığında, bu tür incelikleri üzerinde alacağını düşüktür kamu vicdanında Turing testi".


3
Bunun yanı sıra, Eugene Goostman Turing'in orijinal taklit oyunu ;-) de çöp olurdu
Steve Jessop

9

Sanırım bahsettiğiniz ödüller Loebner Ödülü . Wikipedia sayfasına göre (önceki bağlantıya bakınız), 2014 kazanan Bruce Wilcox tarafından 'Rose'. Bu program sadece bir kerelik ödüllerden birini kazanmadı, ancak 4.000 $ ödül parası kazandı. 'Eugene Goostman' 2005 ve 2008 yıllarında yarıştı ve iki kez de ikinci oldu.

'Eugene Goostman' kazandı yarışması, Alan Turing'in ölümünden 60 yıl sonra Coventry Üniversitesi'nden Kevin Warwick tarafından düzenlendi. Herhangi bir ödül parasının farkında değilim.

Check out Ray Kurzweil'in üstlenmek rekabet ve söz konusu programın her ikisinde. Alıntı:

Profesör Warwick, testin “sınırsız” olduğunu iddia ediyor. Ancak, chatbot'un 13 yaşında bir çocuk olduğunu ve İngilizce'nin ilk dil olmadığı bir çocuk olduğunu iddia etmek etkili bir kısıtlamadır. Ayrıca, etkileşimlerin her biri beş dakika ile sınırlı olduğu bildirildi. Bu kadar kısa bir sürede saf hâkimleri kandırma olasılığı yüksektir.

Chatbot Eugene Goostman ile sohbet ettim ve etkilenmedim. Eugene konuşmayı takip etmez, kendini kelime kelimesi için tekrarlar ve genellikle tipik chatbot olmayan sıralayıcılarla yanıt verir.

Bunu da güzel bir yorum olarak buldum: WIRED - O Bilgisayar Aslında Turing Testinde F Oldu


1
Kablolu parçayı da çok beğendim, özellikle "1991 yarışmasında PC Therapist adında bir bot, 10 hakimin beşinden beşinin insan olduğuna inanmasını sağladı." Ayrıca "özel">% 30 aptallık eşiği ile ilgili olarak: "Turing testinin babası bunu istihbarat için bir eşik olarak kullanmıyordu, basitçe bilgisayarların gelecekte yirmi yıl olacağını düşündüğünü tahmin ediyordu. "
Fizz

10
Özetle: Eugene bot bu testi insan zekasını simüle ederek değil, insan aptallığını simüle ederek "geçti".
duskwuff

2

"Orijinal" Turing Testi hakkında daha fazla derinlik için Wikipedia bağlantısı ekleme . "Turing testi" adı verilen birçok test var. Wikipedia "en az 3 birincil sürümden" bahsediyor. Eugeene tarafından geçen test, bunların hiçbiri 3 değildir. Eugeene tarafından geçen test Alan Turing tarafından tasarlanmamıştır, ancak Alan Turing'den esinlenerek Turing denilen bir testti ve Eugeene bunu geçti.

Turing testinin en az 3 birincil versiyonundan bahseden kısım:

Saul Traiger, Turing testinin en az üç birincil versiyonunun olduğunu ve bunların ikisi de "Bilişim Makineleri ve İstihbarat" bölümünde ve "Standart Yorumlama" olarak tanımladığı bir versiyonun sunulduğunu savunuyor. "Standart Yorumlama" nın Turing tarafından tarif edilip edilmediğine veya bunun yerine makalesinin yanlış yazılmasına dayanıp dayanmadığına dair bazı tartışmalar olsa da, bu üç versiyon eşdeğer kabul edilmez ve güçlü ve zayıf yönleri farklıdır.

Versiyon 1

Turing'in orijinal oyunu, üç oyuncuyu içeren basit bir parti oyunu tanımladı. Oyuncu A erkek, oyuncu B kadın ve oyuncu C (sorgulayıcı rolünü oynayan) her iki cinsiyetten. Taklit Oyununda, oyuncu C oyuncu A ya da oyuncu B'yi göremez ve onlarla yalnızca yazılı notlar aracılığıyla iletişim kurabilir. A oyuncusu ve B oyuncusu soruları sorarak C oyuncusu bu ikisinden hangisinin erkek ve hangisinin kadın olduğunu belirlemeye çalışır. Oyuncu A'nın rolü, sorgulayıcıyı yanlış karar vermesi için kandırmak, B oyuncusu ise sorgulayıcıya doğru kararı vermesine yardımcı olmaya çalışır.

Versiyon 2

İkinci versiyon daha sonra Turing'in 1950 tarihli makalesinde yayınlandı. Orijinal Taklit Oyun Testine benzer şekilde, A oyuncusunun rolü bir bilgisayar tarafından gerçekleştirilir. Bununla birlikte, B oyuncusunun rolü bir kadın yerine bir erkek tarafından gerçekleştirilir. [...] Bu versiyonda, hem A oyuncusu (bilgisayar) hem de B oyuncusu sorgulayıcıyı yanlış bir karar vermesi için kandırmaya çalışıyor.

Sürüm 3

Ortak anlayış Turing Testinin amacının, bir bilgisayarın sorgulayıcıyı insan olduğuna inanmak için kandırıp kandıramayacağını değil, bir bilgisayarın bir insanı taklit edip edemeyeceğini belirlemektir. Bu yorumun Turing tarafından tasarlanıp tasarlanmadığına dair bazı anlaşmazlıklar olsa da - Sterrett bunun ikinci versiyon olduğuna inanıyor ve bu nedenle bununla yüzleşiyor, Traiger gibi diğerleri ise - bu yine de " standart yorumlama. " Bu versiyonda A oyuncusu bir bilgisayar ve B oyuncusu da her iki cinsiyetten biri. Sorgulayıcının rolü hangisinin erkek, hangisinin kadın olduğunu, hangisinin bilgisayar ve hangisinin insan olduğunu belirlemektir. Standart yorumlamanın temel meselesi, sorgulayıcının hangi cevaplayıcının insan hangisinin makine olduğunu ayırt edememesidir. Süre ile ilgili sorunlar vardır, ancak standart yorum genellikle bu sınırlamayı makul olması gereken bir şey olarak görür.

Buna karşılık, Eugeene tarafından geçirilen test, 5 hakemle bir sohbet botu ile sohbet eden insan hakimlere sahipti, bundan sonra bir bot olup olmadığına karar vermek zorunda kaldılar.


0

Evet, Alan Turing'in orijinal tanımını mümkün olduğunca yakından takip eden "a" Turing Testi kazandı.
Ancak bu, özellikleri Alan Turing'in tanımından farklı olan Loebner Ödülü olan 25000 dolarlık para ödülü versiyonu değildi.
Daha da önemlisi, Alan Turing bunun asla ilk etapta gerçek bir test olması anlamına gelmedi, bu yüzden sonuç zeka kanıtı değil, eğer aslında bilmek istediğiniz şey buysa.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.