Denetimsiz öğrenmeye ilişkin (kümelenme gibi), performansı değerlendirmek için herhangi bir ölçüm var mı?
Denetimsiz öğrenmeye ilişkin (kümelenme gibi), performansı değerlendirmek için herhangi bir ölçüm var mı?
Yanıtlar:
Bir anlamda, bu sorunun cevapsız olduğunu düşünüyorum. Bunu söylüyorum, çünkü belirli bir denetimsiz yöntemin ne kadar iyi performans gösterdiği, büyük ölçüde birinin neden denetimsiz öğrenmeyi gerçekleştirdiğine, yani yöntem nihai hedefiniz bağlamında iyi performans gösterdiğine bağlı olacaktır. Açıkçası bu tamamen doğru değil, insanlar bu problemler üzerinde çalışıyor ve bir tür değerlendirme içeren sonuçlar yayınlıyorlar. Aşağıda aşina olduğum birkaç yaklaşımdan bahsedeceğim.
Kümeleme için iyi bir kaynak (referanslarla birlikte) sklearn'ün dokümantasyon sayfası, Küme Performansı Değerlendirmesi'dir . Bu, birkaç yöntemi kapsar, ancak tümü hariç, Siluet Katsayısı, temel gerçeği etiketlerinin mevcut olduğunu varsayar. Bu yöntem ayrıca , bu soruya ilişkin yorumlardaki bağlantılı kümelenme değerlendirme ölçüsü sorusunda da belirtilmiştir .
Eğer denetlenmemiş öğrenme yönteminiz olasılıksal ise, başka bir seçenek, tutulan veriler üzerinde bazı olasılık ölçütlerini (log-olabilirliği, şaşkınlık, vb.) Değerlendirmektir. Buradaki motivasyon, eğer denetimsiz öğrenme yönteminiz parametrelere uymayan benzer verilere yüksek olasılıklar veriyorsa, muhtemelen ilgi dağılımını yakalamak için iyi bir iş çıkarmıştır. Bu tür bir değerlendirmenin yaygın olarak kullanıldığı bir alan dil modellemesidir.
Bahsedeceğim son seçenek, ilgili bir yardımcı görevde denetimli bir öğrenci kullanmaktır. Denetlenmeyen bir yöntem gizli değişkenler oluşturuyorsa, bu gizli değişkenleri girdinin temsili olarak düşünebilirsiniz. Bu nedenle, bu gizli değişkenleri, verilerin bulunduğu alanla ilgili bir görev yapan denetimli bir sınıflandırıcı için girdi olarak kullanmak mantıklıdır. Denetlenen yöntemin performansı daha sonra denetlenmemiş öğrencinin performansı için bir vekil olarak görev yapabilir. Bu aslında temsil öğrenimi üzerine yapılan çalışmaların çoğunda gördüğünüz kurulumdur.
Bu açıklama muhtemelen biraz muğlak, bu yüzden somut bir örnek vereceğim. Kelime temsili öğrenme üzerine yapılan çalışmaların neredeyse tamamı değerlendirme için aşağıdaki yaklaşımı kullanır:
Eylem bu yaklaşımın bir örneği için incelemeye bakın Kelime gözlemler Eğitim Serbest Boltzmann makineler Dahl ve ark.