Makine öğrenmesinde korelasyon ve nedensellik arasındaki ilişki nedir?


13

"Korelasyonun nedenselliğe eşit olmadığı" iyi bilinen bir gerçektir, ancak makine öğrenimi neredeyse tamamen korelasyona dayalı gibi görünmektedir. Öğrencilerin geçmiş performanslarına dayalı sorulardaki performanslarını tahmin etmek için bir sistem üzerinde çalışıyorum. Google arama gibi diğer görevlerin aksine, bu kolayca oynatılabilecek bir sistem gibi görünmüyor - bu nedenle nedensellik bu anlamda gerçekten alakalı değil.

Açıkçası, sistemi optimize etmek için deneyler yapmak istiyorsak, korelasyon / nedensellik ayrımını önemsememiz gerekecek. Ancak, uygun zorluk seviyesindeki soruları seçmek için sadece bir sistem kurmak açısından bu ayrımın herhangi bir önemi var mı?


Tanımlamak ya da en azından siz "Korelasyon eşit değildir nedensellik'i yok" korelasyon nedensellik demek ne bakınız
seteropere

Yanıtlar:


11

AI'nin tümü korelasyon üzerinde çalışmaz, Bayesian İnanç Ağları A'nın B'ye neden olma olasılığı etrafında inşa edilir.

Öğrencilerin geçmiş performanslarına dayalı sorulardaki performanslarını tahmin etmek için bir sistem üzerinde çalışıyorum.

Bunun için nedenselliğe ihtiyacın olduğunu sanmıyorum. Geçmiş bir performans güncel bir performansa neden olmaz. Erken bir soruya cevap vermek daha sonraki bir soruya cevap vermez.

Ancak, uygun zorluk seviyesine sahip olabilecek soruları seçmek için sadece bir sistem kurmak açısından bakıldığında, bu ayrımın herhangi bir önemi var mı?

Hayır, örneğin değil. Bence korelasyon (hatta basit ekstrapolasyon) probleminizi çok iyi çözecektir. Soruların her birine bir zorluk puanı atayın ve daha sonra öğrencilere giderek daha zor seviyelerde (çoğu sınavın nasıl çalıştığı) sorular besleyin ve sonra öğrenci yanlış anlamaya başladığında, zorluğu geri alabilirsiniz. Bu, çok katmanlı bir algılayıcıda bir nöron üzerinde gerçekleştirilen hata minimizasyonuna benzer bir geri bildirim algoritmasıdır. Bunun gibi önemsiz olmayan girdi alanları, zor bir sorunun ne olduğuna karar vermek!

Yapay zekadaki nedensellik için daha iyi bir örnek:

Arabam yavaşlıyor. Hızlandırıcım yerde. Fazla gürültü yok. Gösterge tablosunda ışıklar var. Yakıtın bitmesi olasılığı nedir?

Bu durumda yakıtın bitmesi aracın yavaşlamasına neden oldu. Bu tam olarak Bayes İnanç Ağlarının çözdüğü bir problemdir.


Diyerek şöyle devam etti: "Bunun için nedenselliğe ihtiyacınız olduğunu düşünmüyorum. Geçmiş bir performans güncel bir performansa neden olmaz. Erken bir soruya cevap vermek, sonraki bir soruya cevap vermez." - bir öğrencinin bir egzersizi tamamlaması, başka bir egzersizde daha iyi performans göstermesine neden olabilir (onlara ipuçları, vb. sağlıyoruz).
Casebash

Ama sanırım haklısın, korelasyon ile nedensellik hakkında çok fazla değil, bir nedensellik ile ilişkili olup olmadığı (yani belirli bir sınıftaki öğrencilerin geometri konularında iyi performans göstermesi, çünkü öğretmen onu daha ayrıntılı olarak ele aldı, vb. yüksek performans sergileme eğilimindeki en zor konuları tamamladılar çünkü
başa çıkanlar

Ah! Bu ilginç: Bir egzersizi tamamlamak ve bunun sonucunu bilmek, sorularda daha iyi olmanın nedenidir. Ancak burada gözlemlenemez. Gözlemlediğiniz tek şey, ilişkili sınav sorularıdır. Korelasyon kirli değildir, iki istatistiksel sürecin bir ilişkisi olduğunu söylemek iyidir.
Dr Rob Lang

A nedenleri B bir inanç ağının bir yorumudur.
seteropere

6

makine öğrenimi neredeyse tamamen korelasyona dayalı görünüyor

Ben öyle düşünmüyorum, en azından genel olarak değil. Örneğin, ML algoritmaları için PAC analizi ve VC boyut analizi açısından temel varsayım , eğitim / test verilerinin gelecekteki verilerin alacağı dağılımdan gelmesidir.

Dolayısıyla, sisteminizde, her öğrencinin belirli konularda belirli tür sorulara cevaplar üreten bir tür koşullu olasılık dağılımı uyguladığını varsaymanız gerekir. Yapmanız gereken bir diğer ve daha sorunlu varsayım, bu dağılımın değişmediği (veya hızlı değişmediği).


2

Önceki cevaplara katılıyorum.

Bununla birlikte, genel olarak korelasyon / nedenselliğe bakmakla ilgileniyorsanız, bakmak isteyebileceğiniz iki öğe şunlardır:

  • Pearl (evet, o Pearl ) üzerinde çok az sayıda iyi kitaptan birini üretti.
  • Takviye Öğrenme ve çoklu silahlı haydut sorununun tümü, bilinmeyen bir ortamda en uygun eylem yollarını çıkarmaya çalışan bir aktöre dayanır - yani hangi 'eylemlerin' onlara en iyi 'ödül' vereceğini öğrenmeleri gerekir ve bu nedenle dolaylı olarak nedenselliği kızdırırlar ilişkiler.

2

Diğer cevaplara ek olarak, ilginç bir konu var - özellikleri manuel olarak seçiyorsanız, fazla takmayı azaltmak için 'tesadüfi korelasyon' hakkında düşünmek isteyebilirsiniz, yani, eğitim verilerinizde bir şekilde ilişkili olan ancak 'Genel durumda t / ilişkilendirilmemelidir - herhangi bir nedensel ilişki yoktur.

Kaba bir örnek olarak, geçmiş sınav sonuçlarının bir veri tablosunu aldığınızı ve başarısız / geç ölçütlerini tahmin etmeye çalıştığınızı varsayalım; mevcut tüm veri alanlarını özellikler olarak dahil edersiniz ve tablonun öğrencilerin doğum gününü de geçirmesini sağlar. Şimdi, 12 Şubat'ta doğan öğrencilerin neredeyse her zaman geçtiği ve 13 Şubat'ta doğan öğrencilerin neredeyse her zaman başarısız olduğu eğitim verilerinde geçerli bir korelasyon olabilir ... ama nedensel bir ilişki olmadığı için bu hariç tutulmalıdır.

Gerçek hayatta biraz daha incedir, ancak verilerinize uyan korelasyonları, öğrenilmesi gereken geçerli sinyallerle ayırt etmeye yardımcı olur; ve egzersiz setinizdeki rastgele gürültünün neden olduğu kalıplardır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.