Bir AI programının EQ'u nasıl ölçülebilir?

Bir AI programında EQ (Duygusal zeka veya duygusal bölüm) olabilir mi?

Başka bir deyişle, bir AI programının EQ'u ölçülebilir mi?

EQ'nun ölçülmesi IQ'dan daha sorunluysa (en azından hem insanlara hem de AI programlarına standart bir uygulama ile), neden böyle?

emotional-intelligence intelligence-testing

— 1010101 Yaşam Tarzı
kaynak

İnsanlar için hangi 'EQ testlerini' biliyorsunuz? Bunları bir yapay zekaya uygulamanın önündeki engel ne olurdu?

— NietzscheanAI

Sorunuzun cevabı "Prensipte, evet" dir - en genel haliyle, EQ testi Turing testinin sadece belirli bir örneğidir ("Nasıl hissedersiniz ...?").

Anlamlı EQ testlerinin başarılmasının neden zor olabileceğini görmek için aşağıdaki iki olası testi göz önünde bulundurun:

Karmaşıklığın bir ucunda, 'Blade Runner' filmi, duygusal olarak yüklü sorulara verilen yanıtlar temelinde insan ve android arasında ayrım yapmak için ünlü bir test gösteriyor.

Modern bir sohbet botuna bu soruları (veya daha basit soruları) sormayı denediyseniz, bir kişiyle konuşmediğinizi muhtemelen çabucak sonuçlandırırsınız.

EQ değerlendirmesi ile ilgili sorun, testi ne kadar duygusal bir şekilde karmaşıklaştırırsa, girdiyi anlamlı bir temsile dönüştürmek için AI sisteminin daha genel olması gerektiğidir.

Yukarıdakilerden diğer uçta, bir EQ testinin bir insan tarafından sağlanan yapılandırılmış girdi ile son derece yapılandırılmış bir şekilde ifade edildiğini varsayalım. Böyle bir durumda, bir 'EQ testindeki' başarı gerçek dünyaya dayanmaz.

"Kaçınılmaz Eliza etkisi ve tehlikeleri" başlıklı bir makalede Douglas Hofstadter, ACME programının (Hofstadter tarafından değil) benzetmeyi 'anlaması' talep edildiği aşağıdaki örneği vermektedir.

Burada bilgisayar, Sluggo adlı bir adamı, karısı Jane ve iyi arkadaşı Buck'u bir şeyin doğal seyrini aldığı ve Jane'in Buck tarafından hamile kaldığı bir bara götürdüğünü öğrenir. Bebeği var ama istemiyor, bu yüzden kocasının yardımıyla bebeği bir nehirde boğuyor, böylece Bambi'nin "problemini" düzgün bir şekilde çözüyor ".

Bu hikaye ACME'ye şu biçimde sunulmaktadır:

ql: (neglectful-husband (Sluggo))
q2: (lonely-and-sex-starved-wife (Jane-Doe))
q3: (macho-ladykiller (Buck-Stag))
q4: (poor-innocent-little-fetus (Bambi))
q5: (takes-out-to-local-bar (Sluggo Jane-Doe Buck-Stag))
...
q11: (neatly-solves-the-problem-of (Jane-Doe Bambi))
q12: (cause (ql0 q11))

Programın Jane Doe'nun davranışının ahlaki olup olmadığını sorulması gerektiğini varsayalım. 'İhmal', 'yalnız' ve 'masum' gibi karmaşık bileşik duygusal kavramlar burada daha derin bir içgözlem incelemesi için AI için mevcut olmayan basit tahminlerdir. Bunların yerine 'bling-blang-blong15657' gibi etiketler de kolayca değiştirilebilir.

Yani bir anlamda, herhangi bir derinlikte bir EQ testinde başarı olmaması, şu anda AI ile karşı karşıya olan genel sorunun göstergesidir: çok daha fazla olan insan dünyasının ince karmaşıklıklarının anlamlı temsillerini tanımlayamama (veya başka türlü öğrenememe) Kedilerin videolarını tanımaktan daha karmaşık.

— NietzscheanAI
kaynak