Makine öğreniminde bir modelin tanımlanması


11

Her zaman temelde bir dağıtım varsaydığımız için bu tanım pek geçerli değildir. Peki bir model gerçekten nedir? Belirtilen hiperparametreleri olan bir GBM bir model olarak düşünülebilir mi? Bir model bir kurallar toplamı mıdır?


2
Genel olarak bir adım daha ileri gidebilir ve en.wikipedia.org/wiki/Mathematical_model'e bakabilirsiniz - çoğu ML modeli, "istatistiksel model" ile eşleşmese bile bu tanımla eşleşir (hemen hemen tüm denetlenmemiş eğitimli veya denetimli ML modelleri istatistiksel modeller olarak değerlendirilir).
Neil Slater

Yanıtlar:


7

Son zamanlarda aynı soruya ilgi duydum ve makine öğreniminde tek bir "model" tanımı olmadığını fark ettim. Danışmanlık yaptığınız kaynaklara, belirli bir yazılım programının belgeleri, kullanıcı topluluğu tarafından benimsenen argo veya dergiden dergiye büyük ölçüde değişebilen yayınlanmış akademik makalelerde kullanılan tanımlara bağlı olabilir. Dahası, bu tür kağıtların sadece makine öğrenimi uzmanları tarafından değil, aynı zamanda makine öğrenimi tekniklerini (görüntüleme, çeşitli tıbbi alanlar vb.) Uygulamak için ihtiyacı olan diğer disiplinlerdeki uzmanlar tarafından yazıldığını da unutmamalıydım. . Birçoğu, sıklıkla gevşek bir şekilde kullanılan "model" terimini açıkça tanımlamamaktadır. İşte "model" I'in sadece birkaç farklı tanımı

• İstatistiksel modeller, özellikle olasılık dağılımları ile ilgili istatistikler.

• Regresyon verileri ve ilgili istatistikler.

• Yukarıda Neil Slater'in belirttiği gibi matematiksel modeller.

• Makine öğreniminde kullanılan sütunlar, veri türleri, veri kaynakları ve diğer meta veriler gibi veri modelleri. Bu özellikle zor çünkü listelediğim ilk üçten farklı olarak bu tanım hakkında hiçbir matematiksel şey yok. Örnek olarak, makine öğrenimi amacıyla çift görev yapan SQL Server "madencilik modelleri" ile ilgili tüm belgelere bakın.

• Bazen yukarıdaki tüm tanımlar, nöral ağların özellikleri gibi denklemler ve meta veriler üzerine inşa edilen makine öğrenme yapılarını içerecek şekilde genişletilir. Diğer durumlarda, bunlar ayrı varlıklar olarak kabul edilir.

Yukarıdakilerin tümü, kaynağa bağlı olarak bazen karıştırılır ve eşleştirilir. "Model" in başka tanımları olduğundan eminim Bu listeden ayrıldım, bu da konuyu daha da karmaşıklaştıracaktır. Bu belirsizlikle başa çıkmak için, kendimi "model" terimini kullandıklarında yazarın niyetlerini ilahi olarak eğitmeye çalışıyorum. Bazen yazarın çalıştığı içeriğe veya alana göre belirlemek kolaydır, ancak diğer zamanlarda anlamaya başlamadan önce bir makaleyi veya belgeyi derinlemesine okumalıyım. Keşke bu konuda daha kesin olsaydım, ama gerçekten doğal bir terim; bunun için tek bir boyuta uyan basit bir cevap asla olmayacak. Umarım bu yardımcı olur.


1
"Model" terimi gerçekten de pek çok şey için geçerli olsa da, Makine Öğrenimi bağlamında, model öğrenme / eğitim yoluyla yaratılan eserdir - örneğin sinir ağları söz konusu olduğunda ağın ağırlıkları ve önyargıları.
Syzygy

5

Amazon Machine Learning hakkındaki makaleden

Bir ML modelinin eğitim süreci, öğrenilecek eğitim verileri ile birlikte bir ML algoritması (yani öğrenme algoritması) sağlamayı içerir. The term ML model refers to the model artifact that is created by the training process.


5

Tom Mitchell tarafından verilen Machine Learning tanımını seviyorum .

Bir bilgisayar programı ile ilgili bilgi edinmek için söylenen deneyim E bazı sınıfına göre görevler , T ve performans ölçüsü P P ile ölçülen T görevleri performansı, deneyim E ile artıp artmadığını

Dolayısıyla, bu tanım göz önüne alındığında, bir modelin bir T sınıfı yaptıktan sonra edinilen deneyim olduğunu söylemeliyim.


Deneyim E eğitim seti değil mi?
Itamar Mushkin

3

Bir model, gevşekçe konuşursak, bir şeyin veya sürecin basitleştirilmesidir. Örneğin, Dünya'nın şekli aslında bir küre değil, bir dünya tasarlıyorsak, ona bir küre gibi davranabiliriz. Benzer şekilde, evrenin deterministik olduğu varsayılarak, bir müşterinin bir web sitesinde ürün satın alıp almayacağını belirleyen bazı doğal süreçler vardır. Bu sürece yaklaşan, müşteri hakkında bazı bilgiler verebileceğimiz ve müşterinin bir ürün satın alacağını düşünüp düşünmediğini söyleyen bir şey inşa edebiliriz.

Bir "makine öğrenme modeli", bir makine öğrenme sistemi tarafından oluşturulan bir modeldir.

(Bunun özür dilerim, titiz bir cevap değil, ama umarım bu hala faydalıdır.)


1

Makine öğrenimi paradigmasında model, her bir tahmin, girdi ve tutucular için sırasıyla girdi yeri sahiplerinin yanı sıra regresyon, sınıflandırma ve pekiştirme kategorileri için model parametrelerinin matematiksel bir ifadesini ifade eder.

Bu ifade, bir model olarak tek bir nörona gömülüdür.

Tek katmanlı algılayıcı ve derin öğrenme modeli için, aktivasyon fonksiyonunu düzenli bir şekilde toplamak ve dikmek için nöronları ve katmanları dikkatlice yürüterek bu modeli çıkarmanız gerekir.


0

Makine öğreniminde, model ağırlık merkezidir ve her şey modelin etrafında döner. Farklı insanların modelin farklı tanımları olmasına rağmen. Ama benim görüşüme göre, "makine öğrenmesindeki model verilere uymaya ve görünmeyen verileri tahmin etmeyi öğrenmeye çalışan hipotezdir" modelinin nasıl tanımlanacağını en iyi şekilde bulabiliriz.


0

Makine öğreniminde bir model, girdi değerleri örneğine veya bu değerlere ilişkin bir tahmin, (yeniden) eylem veya dönüşüm gerçekleştirebilen bir soyutlamadır. Model, genellikle bir temel model, bir polinom ifadesi veya çıktıyı nasıl oluşturacağınızı tanımlayan bir dizi kural (örneğin karar ağacı) olarak kullanılan bir dizi gözlemin ortalama değeri gibi tek bir sayı olabilir.

Genel olarak, bir model, eldeki görevi gerçekleştirmek için optimize edilecek modelin yapısını ve kapasitesini tanımlayan bir dizi kural ve hiper parametre ile tanımlanır. Hiper parametre, polinom derecesi veya karar ağacının derinliği olabilir. Bir model, parametrelerin belirli bir hedefe göre optimize edildiği bir optimizasyon işlemine tabi tutulabilir.

Optimizasyon işlemi genellikle montaj eğitimi olarak adlandırılır ve basitçe model olarak da adlandırılabilen uygun bir modelle sonuçlanır. Bir modelin eğitilmiş olması veya sık sık bağlamdan çıkarılması gerekiyorsa.


0

Bu eğlenceli bir tartışma! İki sentim, bir modelin bir bilgisayarın bazı olası girişlerden uygun çıkış kümesine eşlemeleri tahmin etmek için yorumlayabileceği bilgileri depolamasıdır. Bir model, daha karmaşık bir işleve yaklaşan basit bir işlevin tanımından başka bir şey değildir. Karmaşık fonksiyonun gerçek dünya fenomeni olması gerekli değildir, sadece modelin karmaşık fonksiyonu mükemmel şekilde çoğaltmak için yeterli bilgi saklamadan yaklaşık olarak tahmin etmesi gerekir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.