Denetimsiz öğrenmeyi değerlendirmek için performans ölçümleri


48

Denetimsiz öğrenmeye ilişkin (kümelenme gibi), performansı değerlendirmek için herhangi bir ölçüm var mı?



4
Bence bu soru bundan daha genel, bu yüzden bunu açık bırakmak için oy kullanıyorum.
Peter Flom - Eski Monica

Ben de aynı soruyu sordum ve bazı (henüz tam olarak okunmamış olan) referanslar ilgimi çekti: Küme Doğrulama için İç Geçerlilik Ölçümü Üzerine Bir Araştırma L.Jegatha Deborah, R.Baskaran, A.Kannan ve Küme Geçerliliği Ölçüm Teknikleri Ferenc Kovács, Csaba Legány, Attila Babos
kasterma

Yanıtlar:


43

Bir anlamda, bu sorunun cevapsız olduğunu düşünüyorum. Bunu söylüyorum, çünkü belirli bir denetimsiz yöntemin ne kadar iyi performans gösterdiği, büyük ölçüde birinin neden denetimsiz öğrenmeyi gerçekleştirdiğine, yani yöntem nihai hedefiniz bağlamında iyi performans gösterdiğine bağlı olacaktır. Açıkçası bu tamamen doğru değil, insanlar bu problemler üzerinde çalışıyor ve bir tür değerlendirme içeren sonuçlar yayınlıyorlar. Aşağıda aşina olduğum birkaç yaklaşımdan bahsedeceğim.

Kümeleme için iyi bir kaynak (referanslarla birlikte) sklearn'ün dokümantasyon sayfası, Küme Performansı Değerlendirmesi'dir . Bu, birkaç yöntemi kapsar, ancak tümü hariç, Siluet Katsayısı, temel gerçeği etiketlerinin mevcut olduğunu varsayar. Bu yöntem ayrıca , bu soruya ilişkin yorumlardaki bağlantılı kümelenme değerlendirme ölçüsü sorusunda da belirtilmiştir .

Eğer denetlenmemiş öğrenme yönteminiz olasılıksal ise, başka bir seçenek, tutulan veriler üzerinde bazı olasılık ölçütlerini (log-olabilirliği, şaşkınlık, vb.) Değerlendirmektir. Buradaki motivasyon, eğer denetimsiz öğrenme yönteminiz parametrelere uymayan benzer verilere yüksek olasılıklar veriyorsa, muhtemelen ilgi dağılımını yakalamak için iyi bir iş çıkarmıştır. Bu tür bir değerlendirmenin yaygın olarak kullanıldığı bir alan dil modellemesidir.

Bahsedeceğim son seçenek, ilgili bir yardımcı görevde denetimli bir öğrenci kullanmaktır. Denetlenmeyen bir yöntem gizli değişkenler oluşturuyorsa, bu gizli değişkenleri girdinin temsili olarak düşünebilirsiniz. Bu nedenle, bu gizli değişkenleri, verilerin bulunduğu alanla ilgili bir görev yapan denetimli bir sınıflandırıcı için girdi olarak kullanmak mantıklıdır. Denetlenen yöntemin performansı daha sonra denetlenmemiş öğrencinin performansı için bir vekil olarak görev yapabilir. Bu aslında temsil öğrenimi üzerine yapılan çalışmaların çoğunda gördüğünüz kurulumdur.

Bu açıklama muhtemelen biraz muğlak, bu yüzden somut bir örnek vereceğim. Kelime temsili öğrenme üzerine yapılan çalışmaların neredeyse tamamı değerlendirme için aşağıdaki yaklaşımı kullanır:

  1. Denetimsiz bir öğrenciyi kullanarak kelimelerin temsillerini öğrenin.
  2. Öğrenilen gösterimleri, konuşma etiketleme bölümleri veya adlandırılmış varlık tanıma gibi bazı NLP görevlerini yerine getiren denetimli bir öğrenci için girdi olarak kullanın.
  3. Denetimsiz öğrencinin performansını, girdi olarak ikili kelime varlığı özellikleri gibi standart bir gösterimi kullanarak, denetlenen öğrencinin performansını bir taban çizgisine göre iyileştirme kabiliyeti ile değerlendirin.

Eylem bu yaklaşımın bir örneği için incelemeye bakın Kelime gözlemler Eğitim Serbest Boltzmann makineler Dahl ve ark.


11
+1 " belirli bir denetimsiz yöntemin ne kadar iyi performans gösterdiğine büyük ölçüde birinin neden denetimsiz öğrenmeyi ilk başlarda yaptığına bağlı olacaktır " hemen hemen özetliyor. Belirli bir sonucu haklı çıkarmak için bir şekilde kullanabileceğiniz, sonuçları gerçekten yorumlamadan kullanabileceğiniz sihirli bir numara aramayın .
Marc Claesen

1
Ayrıca, denetimsiz bir yaklaşımın denetlenmeyen bir yaklaşımın ne kadar iyi çalıştığına vekaleten kullanmanın yeni özelliklerin keşfedilmesini gerektirmediğini de eklerdim. Örneğin, kümeleme yeni özellikleri öğrenmez, ancak kümeleme genellikle denetlenen bir öğrencinin tahmin doğruluğunu geliştirmek için kullanılır, bunun neden böyle olduğunu açıklamanın yararı da eklenir. Örneğin, k-aracı kümelemesi, keşfedilen yapıdan yararlanmak ve kümelemeden sıkıştırmak yoluyla her biri iyileştirilmiş k tahminleri üretebilir. Bakınız ttic.uchicago.edu/~shubhendu/Papers/clustering_bagging.pdf
Cybernetic
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.