Yanıtlar:
Lojistik regresyon yaptığınızda, ve olarak kodlanmış iki sınıf verilir . Şimdi, bir birey olarak kodlanan sınıfa ait bazı açıklayıcı varialbes verilen olasılıkları hesaplarsınız . Şimdi bir olasılık eşiği seçerseniz ve olasılığı bu eşikten daha büyük olan tüm bireyleri sınıf ve altı olarak olarak sınıflandırırsanız0 1 1 0, çoğu durumda bazı hatalar yaparsınız çünkü genellikle iki grup mükemmel bir şekilde ayırt edilemez. Bu eşik için artık hatalarınızı ve söz konusu hassasiyet ve özgüllüğü hesaplayabilirsiniz. Bunu birçok eşik için yaparsanız, olası birçok eşik için 1-Özgüllüğe karşı duyarlılık çizerek bir ROC eğrisi oluşturabilirsiniz. İki sınıf arasında ayrım yapmaya çalışan farklı yöntemleri, örneğin, ayrımcı analizi veya bir probit modeli karşılaştırmak istiyorsanız, eğrinin altındaki alan devreye girer. Tüm bu modeller için ROC eğrisini oluşturabilirsiniz ve eğrinin altında en yüksek alana sahip olan en iyi model olarak görülebilir.
Daha derin bir anlayışa ihtiyacınız varsa, buraya tıklayarak ROC eğrileriyle ilgili farklı bir sorunun cevabını da okuyabilirsiniz .
Lojistik regresyon modeli, doğrudan olasılık tahmin yöntemidir. Sınıflandırma kullanımında hiçbir rol oynamamalıdır. Tek tek konulardaki faydaları (kayıp / maliyet fonksiyonu) değerlendirmeye dayalı olmayan herhangi bir sınıflandırma, çok özel acil durumlar dışında uygun değildir. ROC eğrisi burada yararlı değildir; genel sınıflandırma doğruluğu gibi, maksimum olasılık tahmini ile donatılmayan sahte bir model tarafından optimize edilen uygunsuz doğruluk puanlama kuralları olan hassasiyet veya özgüllük de yoktur.
15 p Y p
Bu blogun yazarı değilim ve bu blogu son derece yararlı buldum: http://fouryears.eu/2011/10/12/roc-area-under-the-curve-explained
Bu açıklamayı verilerinize uyguladığınızda, ortalama olumlu örnek, negatif örneklerin yaklaşık% 10'undan daha yüksek puan almıştır.