Dosyalanmış diğer makalelerden okurken benzer sorularım vardı. Ve bununla ilgili çok sayıda soru sordum, örneğin Eğitim Verileri Madenciliği topluluğundaki gibi:
Neden lojistik kayıp yerine olasılıklar üzerinde kare kayıp kullanıyorsunuz?
Burada birçok kişisel görüş sunacağım.
Birçok pratik kullanım durumunda kayıp fonksiyonunun çok önemli olmadığını hissediyorum. Bazı araştırmacılar, kare kaybı hakkında daha fazla bilgi sahibi olabilir ve sistemi inşa edebilir, hala çalışır ve gerçek dünya sorunlarını çözer. Araştırmacılar asla lojistik kaybı veya menteşe kaybını bilmeyebilir ve denemek isteyebilirler. Ayrıca, en uygun matematik modelini bulmakla ilgilenmeyebilirler, ancak daha önce kimsenin çözmeye çalışmadığı gerçek problemleri çözmek isterler.
Bu başka bir örnek: sorumun cevabını kontrol ederseniz, hepsi benzer. Yaklaşık 0-1 kaybına kadar sınıflandırmada farklı kayıp fonksiyonlarını seçmenin etkileri nelerdir?
Daha fazla düşünce: bir makine öğrenimi araştırması, hangi modeli seçeceğinize ve modeli nasıl optimize edeceğinize çok fazla zaman harcayabilir. Bunun nedeni, bir makine öğrenimi araştırmacısının daha fazla veri toplama / daha fazla önlem alma yeteneğine sahip olmaması olabilir. Ve bir makine öğrenen araştırmacının işi, belirli bir gerçek dünya problemini daha iyi çözmemek için daha iyi matematik elde etmektir.
Öte yandan, gerçek dünyada, eğer veri daha iyiyse, her şeyi yener. Bu nedenle, sinir ağını veya rastgele ormanı seçmek çok önemli olmayabilir. Tüm bu modeller, makine öğrenimini gerçek dünya sorunlarını çözmek için bir araç olarak kullanmak isteyen bir kişiye benzer. Matematik veya araç geliştirmekle ilgilenmeyen bir kişi, sistemi daha iyi hale getirmek için belirli alan bilgisini kullanmaya daha fazla zaman ayırabilir.
Yorumda belirttiğim gibi. Ve eğer kişi matematik konusunda özensiz ise, yine de işe yarayan bir şey inşa edebilir.