“Bir model öğren” terimi nereden geldi?


10

Genellikle buradaki veri madencilerinin bu terimi kullandığını duydum. Sınıflandırma problemleri üzerinde çalışan bir istatistikçi olarak, "bir sınıflandırıcı yetiştir" terimine aşinayım ve "bir model öğren" in aynı şey olduğunu varsayıyorum. "Sınıflandırıcı yetiştir" terimini umursamıyorum. Bu, eğitim verileri model parametrelerinin iyi veya "geliştirilmiş" tahminlerini almak için kullanıldığından bir modelin takılması fikrini tasvir ediyor gibi görünüyor. Ama öğrenmek bilgi kazanmak demektir. Basit İngilizce'de "bir model öğrenmek" ne olduğunu bilmek anlamına gelir. Ama aslında modeli asla "bilmiyoruz". Modeller gerçeğe yakındır, ancak hiçbir model doğru değildir. Box, "Hiçbir model doğru değil, bazıları yararlı" dedi.

Veri madencilerinin yanıtını duymak isterim. Terim nasıl ortaya çıktı? Eğer kullanırsanız, neden seviyorsunuz?


Komik kısmı "bir model öğrenmek" en fazla "tüm parametrelerini ezberlemek" anlamına gelir, bu nedenle "öğrenmenin" burada iyi bir kelime olup olmadığını tartışmasanız bile yanlıştır. Kendi dilimde (pl) resmi terminoloji "bir model öğretmek" olsa da, "makine öğrenimi" "makine öğretimi" yerine "makine öğrenimi" olarak adlandırılmaktadır.

Kenar Çubuğu: Kutu teklifi için bir referansınız var mı?
entropi

Yanıtlar:


8

Kökenlerinin, sinir ağının, kendimizden öğrendiğimiz gibi insan beyninde meydana gelene benzer bir şekilde sinaptik ağırlıkların modifikasyonu yoluyla bir veri modeli öğrenmesi olarak düşünülebileceği yapay sinir ağı araştırma topluluğunda olduğundan şüpheleniyorum. deneyim. Araştırma kariyerim yapay sinir ağlarında başladı, bu yüzden bazen ifadeyi kullanıyorum.

Belki de modeli, denklem yerine modelin parametrelerine kodlanmış olarak düşünürseniz, zihinsel bir model beynin bir dizi parametre kadar tanımlanabilir bir fiziksel bileşen olmadığı gibi daha mantıklıdır. bazı nöronlarımız için ayarlar.

Zihinsel bir modelin mutlaka doğru olduğuna dair bir ima olmadığını da unutmayın!


1
Çalışma liderim ve ben bu tartışmayı yaptık ve burada bu tartışmayla ilgili bir soru yayınladım stats.stackexchange.com/questions/43559/… . Model uydurma, eğitim, tahmin ve öğrenmenin sadece belirli bir formun bir modelini tanımlayan en iyi parametreleri bulmak için bazı optimizasyon yöntemlerinin uygulanması anlamına geldiğini anladım.
entropi

6

Terim yapay zekada oldukça eskidir. Onun 1950 yılında "Öğrenme Makineleri" üzerinde uzun bölüm ayrılmıştır Turing İşlem Mak ve İstihbarat kağıt Akıl ve niteliksel denetimli öğrenme dışarı koymaktadır. Rosenblatt'ın orijinal makalesi: Perceptron: 1958'den Beyin gazetesinde Bilgi Depolama ve Organizasyon için Olasılıksal Bir Model, “Matematiksel Öğrenme Modeli” hakkında yoğun bir şekilde konuşuyor. Burada algılayıcı bir “öğrenme modeli” idi; modeller "öğrenilmedi".

Pitts ve McCullough 1943 gazetesi - orijinal "sinir ağları" makalesi - öğrenme ile gerçekten ilgili değildi, daha çok mantıklı bir hesap oluşturma (Hilbert veya Gentzen sistemi gibi, ama bence Russell / Whitehead gibi) çıkarsama yapabilir. Bence bu gelenekte sembolik öğrenme kavramının aksine, sayısal olarak ortaya çıkan "Algılayıcılar" makalesi oldu.

Bir makinenin satranç oynamayı sadece örneklerden öğrenmesi mümkün müdür? Evet. Satranç oynamak için bir modeli var mı? Evet. En uygun model mi (bir tane varsayarsak)? Neredeyse kesinlikle değil. Sade İngilizce satranç oynayabilirsem "satranç öğrendim" - belki de oldukça iyi. Bu en iyi satranç oyuncusu olduğum anlamına gelmez. Turing'in makalesinde satrancı öğrenmeyi tartıştığında "öğrenmeyi" tanımladığı şey budur.

Hangi terimi kullandığım konusunda çok tutarsızım. Yani (örneğin) sınıra öğrenme için "özdeşleştirme" diyebilirim, SVM-öğrenme için "tren" diyebilirim, ancak MCMC- "öğrenme" için "optimize et" diyebilirim. Ve ben sadece regresyona "regresyon" diyorum.


Sorum, öğrenme terimini sınıflandırmada kullanmak değil, “bir model öğrenme” ifadesini kullanmaktı. Makine öğrenimi çok tanıdık ama "bir model öğrenmek", bu sitede ilk kez duyduğum bir cümledir.
Michael R. Chernick

Oraya biraz bulanıklık ekledim, ama haklısın, bu harika bir cevap değil, "model" hakkında fazla tartışma yapmadan öğrenmeye başladım. Bugün bir şey hatırlayıp hatırlayamadığımı göreceğim, ama aklıma bir şey gelmezse bu akşam kaldırabilirim.
Patrick Caldon

Bu cevabı silecektim, ama açıkça birkaç kişi bunu sevdi! Sanırım "öğrenme" teriminin bu bağlamda nereden geldiğine dair makul bir özet.
Patrick Caldon

+1 Ben bir oylama veriyorum, çünkü sorunun biraz dışında olsa da, ilgili ve ilginç ve 3 oy aldı. İçinde tutun.
Michael R.Chernick

2

Bioplausible Machine Learning'de bir araştırmacı olarak, "hiçbir model doğru değil, bazıları yararlı" diye katılıyorum ve aslında modellerin ve formalizmlerin, problemin optimizasyonu hakkında, yaptıkları şeyden bahseden yazarlar tarafından kullanılan güçlü başarısızlığa sahip olduğunu düşünüyorum. bir modeli optimize etmek, yani parametre alanını keşfetmek ve yerel veya umarım küresel bir optimum bulmaktır. Bu genel olarak gerçek sorun için bir optimum değildir . Bir modelin yaratıcısı normalde doğru terminolojiyi kullanır ve tüm varsayımları ortaya koyarken, çoğu kullanıcı, çoğunlukla tutmadığı bilinen varsayımlara dikkat çeker ve aynı zamanda "öğrenme" ve "optimizasyon" ve " ölçülebilirliği".

Bir modelin bu optimal parametreleştirmesinin insanların Makine Öğreniminde, özellikle denetimli Makine Öğreniminde ne anlama geldiğini düşünüyorum, ancak "modeli öğren" i çok duyduğumu söyleyemem - ama bu gerçekleşir ve kişi Modeli eğitir, bilgisayar modelin parametrelerini öğrenir. Gözetimsiz öğrenmede bile, "öğrenme" çoğunlukla bir modelin parametreleştirilmesidir ve umarım "bir modelin öğrenilmesi", bir modelin optimal parametrelenmesidir (her ne kadar kanıtlanabilir olsa da, parametre alanında arama yapmanın farklı yolları bulunmasına rağmen) aynı şeyi optimize etmek için). Gerçekten "bir model eğitimi" kullanmayı tercih ederim

Aslında, araştırmamın çoğu, modeli daha iyi bir model veya daha hesaplamalı ve bilişsel / biyolojik / ekolojik olarak makul bir model keşfetmek açısından öğrenmekle ilgilidir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.