Makine öğrenmesi bağlamında, aradaki fark nedir?
- denetimsiz öğrenme
- denetimli öğrenme ve
- yarı denetimli öğrenme?
Ve bakılması gereken temel algoritmik yaklaşımlardan bazıları nelerdir?
Makine öğrenmesi bağlamında, aradaki fark nedir?
Ve bakılması gereken temel algoritmik yaklaşımlardan bazıları nelerdir?
Yanıtlar:
Genel olarak, makine öğrenmesi problemleri sınıflandırma, tahmin veya modelleme için fonksiyon tahminindeki çeşitlilik olarak kabul edilebilir.
Gelen denetlenen öğrenme bir girişi (ile döşenmiştir , , ...,) ve çıkış ( , , ...,) ile genelleştirilebilir şekilde bu davranışı yaklaşır bir işlev bulmakla zorlanmaktadır. Çıktı bir sınıf etiketi (sınıflandırmada) veya gerçek bir sayı (regresyonda) olabilir - bunlar denetimli öğrenmedeki "süpervizyon" dur.
Durumunda denetimsiz öğrenme , baz durumda, girişler aldığı , , ..., çevresinden ama hiçbiri hedef çıkışları, ne de ödülleri verilmektedir. Probleme (sınıflandırma veya tahmin etme) ve örneklenen alan hakkındaki temel bilgilerinize dayanarak, çeşitli yöntemler kullanabilirsiniz: yoğunluk tahmini (tahmin için bazı temel PDF tahminleri), k-kümeleme (etiketlenmemiş gerçek değerli verilerin sınıflandırılması), k- modlar kümeleme (etiketlenmemiş kategorik verilerin sınıflandırılması) vb.
Yarı denetimli öğrenme , etiketli ve etiketlenmemiş veriler üzerinde fonksiyon kestirimini içerir. Bu yaklaşım etiketli verilerin genellikle üretilmemesi pahalı olduğu için motive edilir. Buradaki zorluk, çoğunlukla, bu şekilde karışık verilerin nasıl ele alınacağına ilişkin teknik soruyu içerir. Yarı denetimli öğrenme yöntemleri hakkında daha fazla ayrıntı için bu Yarı Denetimli Öğrenme Edebiyatı Araştırmasına bakın.
Öğrenme bu çeşit ek olarak, örneğin, diğerleri bulunmaktadır takviye öğrenme üreten eylemleri ile çevresiyle öğrenme yöntemi etkileşime sayede , . . .. bu ödül veya cezalar verir , , ...
Denetimsiz Öğrenme
Denetimsiz öğrenme, eğitim için etiketli bir veriniz olmadığı zamandır. Bunun örnekleri genellikle kümeleme yöntemleridir.
Denetimli Öğrenme
Bu durumda, eğitim verileriniz etiketli verilerden oluşur. Burada çözdüğünüz sorun genellikle etiketsiz veri noktaları için etiketleri öngörmektir.
Yarı Denetimli Öğrenme
Bu durumda, hem etiketlenmiş veriler hem de etiketlenmemiş veriler kullanılır. Bu, örneğin, bazı katmanların veri yapısını öğrendiği (denetimsiz) ve bir katmanı sınıflandırma yapmak için (denetlenen verilerle eğitilmiş) kullanılan Derin inanç ağlarında kullanılabilir.
Denetlenen / denetlenmeyenin, düşünmenin en iyi yolu olduğunu sanmıyorum. Temel veri madenciliği için ne yapmaya çalıştığınızı düşünmek daha iyidir. Dört ana görev vardır:
öngörü. Gerçek bir sayı öngörüyorsanız, buna regresyon denir. Bir tam sayı veya sınıfı öngörüyorsanız, buna sınıflandırma denir.
modellemesi. modelleme öngörü ile aynıdır, ancak model insanlar tarafından anlaşılabilir. Yapay sinir ağları ve destek vektör makineleri harika çalışır, ancak anlaşılır modeller üretmezler [1]. karar ağaçları ve klasik doğrusal regresyon, anlaşılması kolay modellerin örnekleridir.
benzerlik. doğal nitelik grupları bulmaya çalışıyorsanız, buna faktör analizi denir. doğal gözlem gruplarını bulmaya çalışıyorsanız, buna kümeleme denir.
birliği. bu korelasyona çok benziyor, ancak muazzam ikili veri setleri için.
[1] Görünüşe göre Goldman Sachs, tahmin için tonlarca büyük sinir ağı yarattı, ama sonra kimse onları anlamadı, bu yüzden sinir ağlarını açıklamaya çalışmak için başka programlar yazmak zorunda kaldılar.