Ortalama kare hatası sınıflandırma için kullanılabilir mi?


14

Ortalama kare hata formülünü ve nasıl hesaplanacağını biliyorum. Bir regresyon hakkında konuştuğumuzda, ortalama kare hatasını hesaplayabiliriz. Ancak bir sınıflandırma problemi için bir MSE ve bunun nasıl hesaplanacağı hakkında konuşabilir miyiz?

Yanıtlar:


12

Birçok sınıflandırıcı sürekli skorları tahmin edebilir. Genellikle, sürekli puanlar, sınıflandırmanın son adımı olarak yalnızca sınıf etiketlerine (genellikle eşik olarak) dönüştürülen ara sonuçlardır. Diğer durumlarda, örneğin sınıf üyeliği için posterior olasılıklar hesaplanabilir (örneğin, ayrımcı analiz, lojistik regresyon). MSE'yi sınıf etiketleri yerine bu sürekli puanları kullanarak hesaplayabilirsiniz. Bunun avantajı, ikiye ayrılma nedeniyle bilgi kaybından kaçınmanızdır.
Sürekli puan bir olasılık olduğunda, MSE metriğine Brier puanı denir.

Bununla birlikte, kılık değiştirmede daha çok regresyon problemleri olan sınıflandırma problemleri de vardır. Alanımda, örneğin, bazı maddelerin konsantrasyonunun yasal bir sınırı aşıp aşmadığına göre (bu ikili / ayrımcı iki sınıflı bir problemdir) vakaları sınıflandırabiliyor. Burada MSE, görevin altında yatan regresyon doğası nedeniyle doğal bir seçimdir.

Bu yazıda daha genel bir çerçevenin parçası olarak açıklıyoruz: C. Beleites, R. Salzer ve V. Sergo:
Kısmi Sınıf Üyelikleri Kullanarak Yumuşak Sınıflandırma Modellerinin Doğrulanması: Astrositoma Dokularının Sınıflandırılmasında Uygulanan Genişletilmiş Bir Hassasiyet Kavramı ve Co.
Chemom. Intell. Lab. Syst., 122 (2013), 12-22.

Nasıl hesaplanır: R'de çalışıyorsanız, bir uygulama "softclassval" paketindedir, http: /softclassval.r-forge.r-project.org.


@ seanv507: çok teşekkürler!
Sb ile mutsuz cbeleites

1

Nasıl başarılı olduğunu görmüyorum ... başarılı sınıflandırma ikili bir değişken (doğru ya da değil), bu yüzden ne kare görmek zor.

Genel olarak sınıflandırmalar, bir eğitim setinden tahmin edilen bir sınıflandırma, daha önce bir kenara bırakılan bir test setine uygulandığında, yüzde doğru gibi göstergeler üzerinde ölçülür.

Ortalama kare hatası, sürekli değişkenlerin tahminleri veya tahmin edilen değerleri için kesinlikle hesaplanabilir (ve hesaplanır), ancak sınıflandırmalar için değil.


0

π^

L=Πbenπ^benyben(1-π^ben)1-yben

Bu olasılık, Bernoulli dağılımına sahip olduğu varsayılan ikili yanıt içindir.

L


0

Teknik olarak yapabilirsiniz, ancak MSE işlevi ikili sınıflandırma için dışbükey değildir. Bu nedenle, bir ikili sınıflandırma modeli MSE Maliyet işlevi ile eğitilmişse, Maliyet işlevinin en aza indirilmesi garanti edilmez . Ayrıca, MSE'nin bir maliyet fonksiyonu olarak kullanılması, ikili sınıflandırma için geçerli olmayan Gauss dağılımını varsayar.


1
MSE neden Gauss dağılımını varsayar? (Diyelim ki, en küçük kareler regresyonu
MSE'yi

İkili sınıflandırma için değil regresyon için en uygunudur. Soru ikili içindi.
Mostafa Nakhaei

Soru ikili sınıflandırma değildir . Ayrımcı sınıflandırma bile söylemiyor. Ve sadece MSE'nin kullanılıp kullanılamayacağı konusunda optimallik sormaz (bunun için durum hakkında ikili veya ayrımcı söylemekten daha belirgin olmanız gerekir). Ayrıca, Brier's puanı tahmin için kesinlikle uygun bir puanlama kuralıdır, bu nedenle iyimser olmama hakkında daha ayrıntılı bir açıklama kesinlikle yararlı olacaktır (ve muhtemelen bu iyimserliğin ne zaman geçerli olduğu konusunda çok aydınlatıcı).
Sb ile mutsuz cbeleites
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.