Denetimli ve denetimsiz öğrenme arasındaki fark tam olarak nedir?


28

Kümeleme yöntemlerini anlamaya çalışıyorum.

Ne anladığımı sanıyordum:

  1. Denetimli öğrenmede, hesaplamalardan önce bilinen kategoriler / etiketler verisi atanır. Dolayısıyla, bu kümeler için gerçekten önemli olan parametreleri “öğrenmek” için etiketler, sınıflar veya kategoriler kullanılmaktadır.

  2. Denetimsiz öğrenmede, kümeler bilinmeden veri kümeleri bölümlere atanır.

Bu, hangi parametrelerin segmentasyon için çok önemli olduğunu bilmiyorum bile, denetimli öğrenmeyi tercih etmem gerektiği anlamına mı geliyor?


2
Kümelemenin denetlenmeyen öğrenmenin tek türü olmadığına dikkat edin.
George,

1
Etiketli eğitim verileri mevcut olduğunda denetimli öğrenme tercih edilir. Denetlenen veya denetlenmeyen yöntemleri kullanarak verilerinizi bölümlere ayırabilirsiniz. Başlıca fark, denetlenen ortamda, egzersiz verileriniz için DOĞRU segmentasyonunu bilmenizdir.
Nick,

Yanıtlar:


23

Aradaki fark, denetimli öğrenmede "kategoriler", "sınıflar" veya "etiketlerin" bilinmesidir. Denetimsiz öğrenmede, onlar değildir ve öğrenme süreci uygun "kategoriler" bulmaya çalışır. Her iki öğrenme türünde de, sınıflandırmada hangisinin en uygun olduğunu belirlemek için tüm parametreler göz önünde bulundurulur.

Denetimli veya denetimsiz seçmiş olup olmamanız, verilerinizin "kategorileri" nin ne olup olmadığını bilmenize bağlı olmalıdır. Biliyorsanız, denetimli öğrenmeyi kullanın. Eğer bilmiyorsanız, o zaman denetimsiz kullanın.

Çok sayıda parametreniz olduğundan ve hangilerinin alakalı olduğunu bilmediğinizden , ilgili olanları belirlemeye yardımcı olmak için temel bileşen analizi gibi bir şey kullanabilirsiniz .


13

2 dereceden fazla denetim olduğunu unutmayın. Örneğin, Christian Biemann'ın Doktora tezinde 24-25 (6-7) sayfalarına bakın , Yapı Keşif Paradigmasında 2007 Denetimsiz ve Bilgisiz Doğal Dil İşleme.

Tez 4 dereceyi tanımlar: denetlenir, yarı denetlenir, zayıf denetlenir ve denetlenmez ve farklılıkları doğal dil işleme bağlamında açıklar. İşte ilgili tanımlar:

  • Gelen denetimli sistemler, bir makine öğrenme algoritmasına sunulan veriler tamamen etiketlenir. Bunun anlamı: Bütün örnekler, makinenin yeniden üretmesi gereken bir sınıflandırma ile sunulur. Bunun için verilerden bir sınıflandırıcı öğrenilir, henüz görülmeyen örneklere etiket atama işlemine sınıflandırma denir.
  • Olarak yarı denetlenen sistemleri, makinenin ilave olarak dikkate etiketlenmemiş verileri almaya bırakılmıştır. Daha büyük veri tabanına bağlı olarak, yarı denetimli sistemler genellikle aynı etiketli örnekleri kullanarak denetimli emsallerinden daha iyi performans gösterir. Bu iyileştirmenin nedeni, etiketlenmemiş verilerin daha yüksek olması için sistemin verinin doğal yapısını daha doğru bir şekilde modellemesini sağlamasıdır.
  • Kendi kendine eğitim olarak da adlandırılan önyükleme, daha az eğitim örnekleri kullanmak için tasarlanmış, bu nedenle bazen denetlenmeyen bir öğrenme şeklidir . Önyükleme birkaç eğitim örneğiyle başlar, bir sınıflandırıcı eğitir ve yeniden sınıflandırmak için bu sınıflandırıcı tarafından sağlanan pozitif olması muhtemel örnekleri kullanır. Eğitim örnekleri kümesi büyüdükçe, sınıflandırıcı, çok fazla olumsuz örneğin pozitif olarak yanlış sınıflandırılması durumunda performansın bozulmasına yol açabilecek şekilde geliştirir.
  • Denetimsiz sistemlere hiç bir eğitim örneği verilmemektedir ve kümeleme yapılmaktadır. Bu, veri örneklerinin birkaç gruba bölünmesidir. Kümeleme algoritmalarının sonuçları veriye dayalıdır, dolayısıyla daha 'doğal' ve verinin altında yatan yapıya daha uygundur. Bu avantaj aynı zamanda en büyük dezavantajıdır: makineye ne yapması gerektiğini söyleme imkanı olmadan (sınıflandırmada olduğu gibi), kümelenme sonuçlarının kalitesini kesin bir şekilde değerlendirmek zordur. Ancak, eğitim örneği hazırlığının yokluğu denetlenmemiş paradigmayı çok çekici kılmaktadır.

0

Denetimli öğrenmede sınıflar önceden bilinmektedir ve ayrıca türleri, örneğin iki sınıf iyi ve kötü müşterilerdir. Yeni nesne (müşteri) özelliklerine göre geldiğinde, müşteri kötü veya iyi müşteri sınıfına atanabilir.

Denetimsiz öğrenmede gruplar / sınıflar zaten bilinmemektedir, nesnelerimiz (müşterilerimiz) vardır, bu nedenle benzer satın alma alışkanlıklarına sahip müşterileri gruplandırın, dolayısıyla farklı gruplar müşterilerden oluşur, yani benzer alışkanlıklara dayanarak bilinmez.


0

Denetimli öğrenmede çıktı (bağımlı değişken) girdi değişkenine (bağımsız değişken) bağlıdır. Bazı denetimlerde, cevap veren istenen hedefi hesaplamaya çalışır.

Denetimsiz öğrenmede denetim yoktur, bu yüzden sistem kendini duruma adapte etmeye çalışır ve bir ölçüme dayanarak elle öğrenir.

örneğin: Bir sınıf öğretmenliği - denetim - denetimli öğrenme Sınıfta bir kendi kendine çalışma seçmeli dersi - No denetimsiz

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.