Bir makine öğrenimi kursu okuyorum ve ders slaytlarında önerilen kitapla çeliştiğim bilgiler var.
Sorun şudur: üç sınıflandırıcı vardır:
- daha düşük eşik aralıklarında daha iyi performans sağlayan A sınıflandırıcısı ,
- daha yüksek eşik aralıklarında daha iyi performans sağlayan Sınıflandırıcı B ,
- Sınıflandırıcı C bir p-coin çevirerek ve iki sınıflandırıcıdan seçerek elde ettiğimiz şeydir.
ROC eğrisinde görüldüğü gibi C sınıflandırıcısının performansı ne olacak?
Ders slaytları, sadece bu madeni parayı çevirerek, A ve B'nin ROC eğrisinin sihirli " dışbükey gövdesini " alacağımızı belirtiyor .
Bu noktayı anlamıyorum. Sadece madalyon çevirerek nasıl bilgi edinebiliriz?
Ders slaydı
Kitap ne diyor
Öte yandan, önerilen kitap ( Veri Madenciliği ..., Ian H. Witten, Eibe Frank ve Mark A. Hall ) şunları belirtmektedir:
Bunu görmek için, sırasıyla tA ve fA'nın doğru ve yanlış pozitif oranlarını veren A yöntemi için belirli bir olasılık kesme ve tB ve fB'yi veren yöntem B için başka bir kesme seçin. Bu iki şemayı, p + q = 1 olan p ve q olasılıkları ile rastgele kullanırsanız, p'nin doğru ve yanlış pozitif oranlarını elde edersiniz. tA + q. tB ve p. fA + q. fB. Bu, (tA, fA) ve (tB, fB) noktalarını birleştiren düz çizgi üzerinde yatan bir noktayı temsil eder ve p ve q'yu değiştirerek bu iki nokta arasındaki tüm çizgiyi takip edebilirsiniz.
Anladığım kadarıyla, kitabın söylediği şey aslında bilgi kazanmak ve dışbükey gövdeye ulaşmak için sadece bir p-coin çevirmekten daha gelişmiş bir şey yapmamız gerektiğidir.
AFAIK, (kitabın önerdiği gibi) doğru yol şudur:
- A sınıflandırıcısı için en uygun eşik Oa'yı bulmalıyız
- B sınıflandırıcısı için optimal bir Ob eşiği bulmalıyız
C'yi aşağıdaki gibi tanımlayın:
- T <Oa ise, t ile A sınıflandırıcısını kullanın
- T> Ob ise, t ile B sınıflandırıcısını kullanın
- Oa <t <Ob ise, Oa ve Ob arasında olduğumuz yerin doğrusal bir kombinasyonu olarak olasılıkla A ile Oa ve B ile sınıflandırıcı arasında seçim yapın.
Bu doğru mu? Evet ise, slaytların önerdiklerine kıyasla birkaç önemli fark vardır.
- Basit bir bozuk para çevirme değil, hangi bölgeye düştüğümüze göre manuel olarak tanımlanan noktalara ve seçimlere ihtiyaç duyan daha gelişmiş bir algoritma.
- Asla A ve B sınıflandırıcılarını Oa ve Ob arasında eşik değerleriyle kullanmaz.
Bana bu sorunu açıklayabilir misiniz ve eğer anlayışım doğru değilse, onu anlamanın doğru yolu nedir?
Slaytların önerdiği gibi bir p-coin çevirirsek ne olur?A ve B arasında bir ROC eğrisi alacağımızı, ancak belirli bir noktada asla daha iyi olandan "daha iyi" olmadığını düşünürdüm.
Görebildiğim kadarıyla, slaytların nasıl doğru olabileceğini gerçekten anlamıyorum. Sol taraftaki olasılıksal hesaplama benim için anlamlı değil.
Güncelleme: Dışbükey gövde yöntemini icat eden orijinal yazar tarafından yazılmış makaleyi buldu: http://www.bmva.org/bmvc/1998/pdf/p082.pdf