Çok sınıflı bir güçlendirilmiş sınıflandırıcıyı kalibre etme


19

Alexandru Niculescu-Mizil ve Rich Caruana'nın " Kalibre Edilmiş Olasılıkları Artırmaktan Elde Etme " adlı makalesini ve bu konudaki tartışmayı okudum . Bununla birlikte, hala çok sınıflı güçlendirici sınıflandırıcımın (karar kütükleri ile hafifçe artırın) çıktısını kalibre etmek için lojistik veya Platt'ın ölçeklendirmesini anlamakta ve uygulamakta sorun yaşıyorum .

Genelleştirilmiş doğrusal modellere biraz aşinayım ve lojistik ve Platt'ın kalibrasyon yöntemlerinin ikili durumda nasıl çalıştığını anladığımı düşünüyorum, ancak makalede açıklanan yöntemi çok sınıflı duruma nasıl genişleteceğimizi bilmiyorum.

Kullandığım sınıflandırıcı aşağıdakileri çıkarır:

  • oyların = sayısı o sınıf için sınıflandırıcı atmalarını j numune için i sınıflandırılmış ediliyorfbenjjben
  • = Tahmini sınıfyben

Bu noktada şu sorularım var:

S1: Olasılıkları tahmin etmek için çok terimli bir logit kullanmam gerekir mi? ya da bunu yine de lojistik regresyonla yapabilir miyim (örneğin 1'e karşı tüm tarzda)?

S2: Çok sınıflı durum için ara hedef değişkenleri (örneğin Platt'un ölçeklemesinde olduğu gibi) nasıl tanımlamalıyım?

S3: Bunun soracak çok şey olabileceğini anlıyorum, ancak bu sorun için sahte kodu kimseye çizmeye istekli olur mu? (daha pratik düzeyde, Matlab'da bir çözümle ilgileniyorum).


1
harika bir soru. Geri kalan şemaya karşı 1'i kullansanız bile kalibrasyonun nasıl yapılacağını merak ettim. Geri kalanlara karşı 1 kullanarak k modelleri oluşturursanız (ve k sınıfları varsa) bunları bir şekilde normalleştirmeniz gerekir (1'i toplamları için (örneğin her kalibre edilmiş olasılığı tüm k toplamına bölün)?
B_Miner

Yanıtlar:


9

Bu benim için de pratik bir konu, bu yüzden biraz araştırma yaptım. Bir yazarın bu konularda genellikle referans olarak listelenen iki makalesi.

  1. Sınıflandırıcı puanlarını doğru çok sınıflı olasılık tahminlerine dönüştürme
  2. Olasılık tahminlerini birleştirerek çoklu sınıfı ikiliye indirgeme

Burada savunulan tekniğin özü, çok sınıflı problemi ikili bir soruna (örneğin, bir diğerine karşı, AKA bire karşı) azaltmak, ikili puanları / olasılıkları ayarlamak için Platt (tercihen bir test seti kullanarak) gibi bir teknik kullanmak ve daha sonra bunları makalelerde tartışıldığı gibi bir teknik kullanarak birleştirin (biri Hastie ve arkadaşlarının "birleştirme" sürecinin bir uzantısıdır). İlk linkte, en iyi sonuçlar ikili olasılıkları 1'e göre normalize ederek bulundu.

Diğer tavsiyeleri duymak isterim ve bu tekniklerden herhangi biri R'de uygulanmışsa.


Yanıtta belirtilen bağlantılar eski. Son bağlantılar: citeseerx.ist.psu.edu/viewdoc/… citeseerx.ist.psu.edu/viewdoc/…
Chandra


Bu cevabı yankılamak. Bu beni bir süre boğdu ama Zadrozny ve Elkan'ın makalesi faydalı oldu.
songololo
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.