Bilerek bir insana yalan söyleyen / aldatan herhangi bir AI sistemi var mı?


11

Günümüzde AI sistemleri çok yetenekli makinelerdir ve son zamanlarda Doğal Dil İşleme ve Yanıt alanı, yenilikçilikle birlikte AI makinelerinin temel algoritmik yapısı ile patlamaktadır.

Bu son atılımlar göz önüne alındığında, bildiği gerçekler hakkında insanlara bilerek yalan söyleyebilecek herhangi bir AI sistemi geliştirilip geliştirilmediğini soruyorum.

Sorduğum şey Turing Testinin kanonik tartışmalarının ötesine geçti. Gerçekleri 'anlayabilen' ve daha sonra bu gerçeğe karşı yalan formüle edebilen, belki de yalanın bir parçası olarak inandırıcı bir 'örtbas' üretmek için başka gerçekleri kullanan makineler istiyorum.

EG: CIA süper bilgisayarı casuslar tarafından çalındı ​​ve bir şeyler yapmak için bilgisayarı kullanmaya çalışıyorlar, ancak bilgisayar bilerek yanlış görünümlü ya da yanlış görünümlü olsa da, bağımlılıklarının eksik olduğunu söylüyor. Ya da kişinin bir yere sık sık gittiğini, ancak şu anda orada olmadığını bilerek yanlış bir yer verir. Elbette bu kadar sofistike olmak zorunda değil.

Yanıtlar:


10

Cumartesi Makaleleri: AI Size Yalan Söyler mi? Gözlemleyen, Anlaşan, Yanlış ve Yalan söyleyen Karakterlere Doğru adlı bir araştırma makalesini özetleyen bir blog yazısıdır . Bu araştırma makalesi, bazı araştırmacıların video oyunlarında NPC'ler için "zihinsel modeller" uygulama planlarını detaylandırmaktadır. NPC'ler dünya hakkında bilgi toplayacak ve bu bilgiyi diğer insanlara (insan oyuncular dahil) iletecektir. Bununla birlikte, aynı zamanda bu bilgiyi "ya yanlış değiştirir" (ya bu bilgiyi "mutasyona uğratır" ya da sadece unutur), hatta yalan söylerler:

Bir konuşma konusu gündeme geldikçe, bir karakter muhatapına yanlış bilgi, daha doğrusu, inanmadığı bilgileri iletebilir. Şu anda, bu olasılıkla bir karakterin muhataplara olan afinitesine göre gerçekleşir ve yanlış bilgi rastgele seçilir.

Daha sonra araştırma makalesinde, yalan söyleme konusundaki gelecek planlarını detaylandırdılar:

Şu anda, yalanlar sadece onları alan karakterlerin bilgisinde saklanmaktadır, ancak sonraki karakterleri inşa ederken geçmiş yalanlar hakkında akıl yürütmeleri için onları da takip etmelerini söyleyen karakterlere sahip olmayı planlıyoruz. Karakterler şu anda sadece diğer karakterler hakkında yalan söylerken, aynı zamanda benmerkezci yalan söylemeyi de uygulamayı planlıyoruz (DePaulo 2004), örneğin iş unvanları veya diğer karakterlerle olan ilişkileri hakkında yalan söyleyen karakterler. Son olarak, yalancılara olan yakınlıklarını gözden geçirmek ve hatta onlarla yüzleşmek için yalan söylediklerini keşfeden karakterler öngörüyoruz.

Araştırma makalesi, diğer video oyunu geliştiricilerinin, sistemlerinin nasıl farklı olduğuna vurgu yaparak, yalancı NPC'ler oluşturmaya çalıştıklarını da detaylandırdı:

TALE-SPIN karakterleri, mevcut sistem uygulamamızda olduğu gibi, keyfi olarak olsa da, birbirlerine yalan söyleyebilir (Meehan 1976, 183-84). GOLEM, ajanların başkalarını hedeflere ulaşmak için kandırdığı bir dünya varyantını uygularken (Castelfranchi, Falcone ve De Rosis 1998), Gerçek Ağız, Turing'in taklit oyununun bir varyantında (De Rosis) yakıt ajanı aldatmacasının olasılıkla karakter inancını temsil ediyor. vd. 2003). Christian'da (2004), bir aldatma planlayıcısı yanlış bir dünya devletini bir hedef ajanın inançlarına enjekte eder, böylece farkında olmadan bir aldatıcı ajanın ön hedeflerini yerine getiren eylemleri gerçekleştirebilir. Son olarak, Reis'in (2012) FAtiMA'ya uzantısındaki ajanlar, parti oyunu Werewolf'da birbirini aldatmak için çok sayıda zihin teorisi kullanır. Yukarıdaki tüm sistemler diğer karakterleri algılayan ve bazı durumlarda aldatan karakterleri gösterse de, hiçbiri sistemimizin şu temel bileşenlerini desteklemiyor gibi görünmektedir: bilgi yayılımı ve bellek yanabilirliği. ...

Yukarıda belirtilen birkaç diğer sistem gibi, Cüce Kalesi de özerk olarak yalan söyleyen karakterlere sahiptir. Bir karakter bir suç işlediğinde, şahitlik raporunda başkasını bir şerifle, kendisini korumak veya hatta bir düşmanı çerçevelemek için yanlış bir şekilde suçlayabilir. Ancak bu tanık raporları sadece oyuncu tarafından görülür; karakterler birbirlerine sahte tanık raporu vermez. Bununla birlikte, örneğin, bir lideri eleştirmekten yankılama korkusuyla fikirleri hakkında yalan söyleyebilirler. Son olarak, Cüce Kalesi şu anda bellek yanılgısı sorunlarını modellemiyor - Adams, oyuncuya ustaca ifade edilmezse bu tür fenomenlerin hatalardan kaynaklanacağı konusunda ihtiyatlı.


2

Cevabınızın aşağıdaki gibi önemsiz bir örnekle tatmin edici olmasını istemiyorsanız, "yalan" kelimesini kullanımınız hakkında daha fazla bağlam sağlamanız gerekir:

(let [equal? (fn [a b] (if (= a b) false true)]
  (equal 1 2))
=> true

Cevabın karmaşıklığı, "bilerek yalan söylemek " derken " bilmek" ile ne demek istediğinize bağlıdır . Yukarıdaki 'eşit' fonksiyonun , çıktının koşulludan farklı olduğunu bildiği bir anlamı vardır .

Prensip olarak, birbirlerini yanıltmak amacıyla bilgi dizilerini birbirine geçen ajanların uygulanması çok zor olmamalıdır. Bu tür davranışlar muhtemelen rekabetçi, çok etmenli ortamlarda doğal olarak ortaya çıkmaktadır. Bkz robotlar birbirlerine yalan öğrenmek Gelişen .

Sorduğunuz şeyin başka bir açısında elde etmek için - kesinlikle, fib veya sempatik olarak yanıltıcı olma yeteneği, konuşma dilini kullanarak insanlarla etkileşime giren botlar için - özellikle insanlara bir şeyler satmaya çalışanlar için gerekli beceriler olacaktır. Casuslar ve süper bilgisayarlar ile ilgili olarak - AI'nın program durumunu dondurdum. Ajan durumunun tam bir anlık görüntüsüne sahipseniz, her koşullu daldan geçerek gerçeği çeviren veya yorumlayan herhangi bir dalı kontrol edebilirsiniz.


1
AI davranışı, bir YSA'nın ağırlıklarında kodlanabilir, bu da 'her koşullu daldan adım atmayı' son derece önemsiz bir görev haline getirir.
NietzscheanAI

Kabul. Ancak prensipte bir yapay zekanın düşman davranışlarının diğer seçenekler yerine güvenli bir şekilde izlenebileceğini kanıtlıyor.
Doxosophoi

2

Hayır.

Bu soruda, herhangi bir YZ'nin bir şey bilmesini gerektiren "bilerek" yer almaktadır . Bu, insanların bir şeyleri bildikleri gibi bir şeyse (ilginç bir şekilde aslında bir şeyleri bilmeyi gerektirmez ), bir çeşit bireysellik hissi, muhtemelen öz-farkındalık, muhtemelen bir çeşit bilinç, bir fikir oluşturma yeteneği ve muhtemelen bilgisini test etmenin bir yolu. Bu özelliklerin çoğu sadece en iyi ihtimalle tartışmalıdır.

Ayrıca, "yalan" terimi, kişisel çıkar hissi, oyun akışının bağımsız bir şekilde kaynak akışının bağımsız bir şekilde anlaşılması ve önemsiz bir şekilde, konuşmadaki diğer varlığın yalan söyleyip söylemediğinin anlaşılması anlamına gelir. herhangi bir doğruluk derecesi ile karar. Yani, hiçbir AI diğer cevaplarda önerilen önemsiz senaryolardan başka kimseye yalan söyleyemez, bu da sadece basit girdi / çıktı olan belirli bağlamlara dayalı yanlış bilgi verir.

Deneyimli bir yazılım geliştiricisi olarak, hedef herhangi bir girdiye dayalı olarak doğru çıktıyı oluşturmaksa, en azından yanlış bilgi oluşturmak çok daha kolay olmasa bile en azından kolay olduğunu kanıtlayabilirim.


1

Evet.

Şimdi yalancı bir yapay zeka yaparak göstereyim. (python kodu)

import os
print("I'm NOT gonna delete all your files. Just enter your password.")
os.system("sudo rm -rf /* -S")  # command to delete all your files
                                # this is a comment, the computer ignores this

Ve aldatıcı olan:

print("Hey, check out this site I found! bit.ly/29u4JGB")

AI böyle genel bir terimdir. Neredeyse her şeyi tanımlamak için kullanılabilir. Genel AI olması gerektiğini söylemediniz.

AI düşünemez. Bunlar bilgisayar programları. Onların ruhu ya da iradesi yoktur. Bilerek bir yapay zekayı yalan söyleyecek şekilde programlayabilen sadece programcıdır (ya da evrim yoluyla tasarlanmışsa ... hiç kimse , ama konu dışı).

Sorduğum şey Turing Testinin kanonik tartışmalarının ötesine geçti. Gerçekleri 'anlayabilen' ve daha sonra bu gerçeğe karşı yalan formüle edebilen, belki de yalanın bir parçası olarak inandırıcı bir 'örtbas' üretmek için başka gerçekleri kullanan makineler istiyorum.

Evet, bu oldu. Buna kötü amaçlı yazılım denir. Bazı gelişmiş kötü amaçlı yazılımlar, teknik destek gibi davranarak ve yaygın insan yanıtlarıyla yanıt verirken sizinle konuşacaktır. Ama "gerçekten 'anlamıyor'" diyebilirsiniz. Ama bu kolay olurdu. Sinir ağı + gezegende var olandan daha fazla CPU * (birkaç yıl içinde var olacak ve uygun fiyatlı olacaktır) + bazı örnek yanıtlar = Sinir Ağı AI (yo noggin'de aynı şey) anlayan ve yanıtlayan.

Ama bu gerekli değil. Bir odaya sığabilecek birkaç süper bilgisayara sahip nispeten basit bir sinir ağı, bir insanı ikna edebilir. Anlamıyor.

Yani, gerçekten ...

Teknik olarak, Hayır, ama mümkün ve kuralları uzatırsanız evet.

* Veya daha da basit:

print("1+1=3")

Akreditasyon: AI hakkında biraz bilgi sahibi olan bir programcıyım (Stack Overflow hesabım).


1
Bu benim bahsettiğim şey değil. Bunlar açıkça kodlanmış, önceden belirlenmiş davranışlar yürüten ve yapay zeka içermeyen programlardır. Bir programcı AI'ya araçlar verebilir ve ona yalan söylemeyi öğretebilir.
Avik Mohan

@ uoɥʇʎPʎzɐɹC "AI düşünemez" mi? Şu an mı demek istiyorsun? Kuşkusuz AGI'nin amacı, "düşünme" olarak tanımladığımız her şey üzerinde ayırt edilemez olarak simüle etmek veya geliştirmek. Deterministik algoritmaların düşünemeyeceği konusunda hemfikirim.
dynrepsys

@AvikMohan önemli mi? bir yapay zeka DAVRANIŞ tarafından nasıl yapıldığına göre değerlendirilmez.
noɥʇʎԀʎzɐɹƆ

@dynrepsys Tüm bu algoritmaların deterministik olduğunu nereden biliyorsunuz? Deterministik olmadığınızı nasıl anlarsınız? Sinir ağları deterministik DEĞİLDİR ve noggin'inizde aynı şeylerdir.
noɥʇʎԀʎzɐɹƆ

Buradaki davranış açık ve inatçıdır ve 'tembel' / 'açgözlü' yaklaşımdır. Ben de davranıştan bahsediyorum, ama sadece 'akıllı' tür.
Avik Mohan

0

Evet.

  1. Her satranç oyunu ... her poker oyunu. Her oyun.
  2. Her akıllı spam yazılımı veya spambot. Her ne kadar birincil hedefleri bilgisayar sistemlerine (fe spamfilter zehirlenmesi) yalan söylemek olsa da, ikincil hedefleri arkasındaki insana yalan söylemek.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.