PAC öğrenme teorisi ne anlama geliyor?


15

Makine öğreniminde yeniyim. Makine öğrenimi konusunda bir ders okuyorum (Stanford Üniversitesi) ve bu teorinin ne anlama geldiğini ve faydasının ne olduğunu anlamadım. Birisinin bu teoriyi benim için detaylandırabileceğini merak ediyorum.

Bu teori bu denkleme dayanmaktadır. resim açıklamasını buraya girin


2
PAC Muhtemelen Yaklaşık Doğru anlamına gelir.
Marc Claesen

@MarcClaesen, Bunu şöyle açıklayabilir miyim: "Makine öğrenimi yaklaşımlarının belirli bir sorun için bir olasılık çözümü sunduğu ve bu çözüm yaklaşık olarak doğru olma eğiliminde olduğu anlamına gelir"
BetterEnglish

Yanıtlar:


16

Muhtemelen yaklaşık olarak doğru (PAC) öğrenme teorisi, bir öğrencinin ( muhtemelen yaklaşık olarak doğru bir sınıflandırıcı üretip üretmeyeceğini ve hangi koşullarda üreteceğini analiz etmeye yardımcı olur . (Bazı kaynakların L yerine A kullandığını göreceksiniz .)LAL

İlk olarak, "yaklaşık" ı tanımlayalım. Girişlerin dağılımı üzerindeki hatası bazı ϵ , 0 ϵ 1 ile sınırlandırılmışsa , hipotezi yaklaşık olarak doğrudur.hHYani,errorD(h)<ϵ, buradaDgirişler üzerindeki dağılımdır.ϵ,0ϵ12.errorD(h)<ϵD

Sonra, "muhtemelen." , 1 - prob olasılıklı , 0 δ 1 ile böyle bir sınıflandırıcı çıkarırsaL1δ , biz bu sınıflandırıcımuhtemelenyaklaşık doğrudiyoruz.0δ12

Bir hedef kavramının PAC ile öğrenilebilir olduğunu bilmek, muhtemelen doğru bir sınıflandırıcıyı öğrenmek için gerekli olan örnek boyutunu sınırlamanıza olanak tanır;

m1ϵ(ln|H|+ln1δ)

Bununla ilgili bazı sezgiler kazanmak için , sağ taraftaki değişkenleri değiştirdiğinizde üzerindeki etkileri not alın . İzin verilen hata azaldıkça , gerekli numune boyutu büyür. Benzer şekilde, yaklaşık olarak doğru bir öğrencinin olasılığı ve hipotez alanı H'nin büyüklüğü ile büyür . (Gevşek olarak, bir hipotez alanı algoritmanızın dikkate aldığı sınıflandırıcılar kümesidir.) Daha açık bir şekilde, daha olası sınıflandırıcılar düşündüğünüzde veya daha düşük bir hata veya daha yüksek doğruluk olasılığı istiyorsanız, aralarında ayrım yapmak için daha fazla veriye ihtiyacınız vardır.mH

Daha fazla bilgi için, bu ve diğer ilgili videolar, örneğin bu uzun tanıtım veya makine öğrenimi metinlerinden biri, örneğin Mitchell gibi yararlı olabilir .


Bu ise uzun zamandır arıyordu yanıtın türü; hem basit hem de sağlam. Birçok kaynak kapsamlı bir cevap vermesine rağmen, hızlı bir referans için çok tercih edilmez.
Ébe Isaac

4


(xi,yi)xiyix~y~
1.000.000 demek. Size 1,2,3, ... 999,999 dizisi verildiyse, bir sonraki sayının 1.000.000 olduğu söylenebilir. Bununla birlikte, bir sonraki sayı 999,999,5, hatta 5 olabilir. Mesele, ne kadar çok veri görürse, kişinin doğru bir model ürettiğinden o kadar emin olabileceği, ancak asla kesinlikle kesin olamayacağıdır.

xi,1imyifθfΘp>1δfΘϵ(δ,ϵ)(δ,ϵ) ve verilen hipotez sınıfının ne kadar karmaşık olduğunu.

Hfθ(ϵ,δ)0<ϵ,δ,<.5fΘx~,y~Err(fΘ(x~),y~)<ϵp>1δm=m(δ,ϵ,H)(fΘ(x~)y~)2

(δ,ϵ)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.