AIC ve c istatistiği farklı soruları cevaplamaya çalışıyor. (Ayrıca c-istatistiği ile ilgili bazı sorunlar son yıllarda ortaya çıkmıştır, ancak bunu bir kenara bırakacağım)
Kabaca konuşma:
- AIC, modelinizin belirli bir yanlış sınıflandırma maliyetine ne kadar iyi uyduğunu söylüyor .
- AUC, modelinizin ortalama olarak tüm yanlış sınıflandırma maliyetlerinde ne kadar iyi çalışacağını söylüyor.
AIC'yi hesaplarken lojistiğinizi, 1'in (1'den 0 olması muhtemel 1'den daha büyük olasılıkla) 1 olacağını öngörerek tahmin etme 0.9 olarak kabul edersiniz. Lojistik puanınızı alabilir ve "0,95'in üzerindeki herhangi bir şey 1, aşağıdaki her şey 0" diyebilirsiniz. Neden bunu yaptın? Bu, gerçekten kendinden emin olduğunuzda yalnızca birini tahmin etmenizi sağlayacaktır. Yanlış pozitif oranın gerçekten çok düşük olacak, ama yanlış negatifin fırlayacak. Bazı durumlarda bu kötü bir şey değildir - eğer sahtekarlıkla suçlanacaksanız, muhtemelen ilk önce gerçekten emin olmak istersiniz. Ayrıca, olumlu sonuçları takip etmek çok pahalı ise, o zaman çok fazla almak istemezsiniz.
Bu nedenle maliyetlerle ilgilidir. Bir 1'i 0 olarak sınıflandırırken bir maliyet ve 0'ı 1 olarak sınıflandırdığınızda bir maliyet vardır. masraflı. Yani, lojistik regresyon, olumlu veya olumsuz tercihleri olmadan, size en iyi toplam doğru tahmin sayısını verir.
ROC eğrisi, farklı maliyet gereklilikleri altında kullandığınızda sınıflandırıcının nasıl bir performans göstereceğini göstermek için gerçek pozitifi yanlış pozitifle karşılaştırdığı için kullanılır. C-istatistiği ortaya çıkar, çünkü kesinlikle bir diğerinin üzerinde yatan herhangi bir ROC eğrisi açıkça baskın bir sınıflandırıcıdır. Bu nedenle, eğri altındaki alanı sınıflandırıcının genel olarak ne kadar iyi olduğunu ölçmek için sezgiseldir.
Bu nedenle, temel olarak, modele uyurken maliyetlerinizi biliyorsanız, AIC (veya benzeri) kullanın. Eğer sadece bir puan oluşturuyorsanız, ancak tanı eşiğini belirtmiyorsanız, AUC yaklaşımlarına ihtiyaç duyulur (AUC'nin kendisi hakkında aşağıdaki ihtarla).
Peki, c-statistic / AUC / Gini'nin nesi var?
Uzun yıllar boyunca AUC standart bir yaklaşımdı ve hala yaygın olarak kullanılıyor, ancak bununla ilgili bir takım sorunlar var. Özellikle çekici kılan şeylerden biri, sınıflandırma saflarındaki bir Wilcox testine karşılık gelmesiydi. Bu, bir sınıfın rastgele seçilmiş bir üyesinin puanının, diğer sınıfın rastgele seçilmiş bir üyesinden daha yüksek olma ihtimalini ölçmüştür. Sorun şu ki, bu neredeyse hiçbir zaman faydalı bir ölçüm değildir.
AUC ile ilgili en kritik sorunlar, birkaç yıl önce David Hand tarafından duyuruldu. (Aşağıdaki referanslara bakın) Sorunun temel noktası, AUC'nin tüm maliyetler üzerinden ortalama yapmasına rağmen, ROC eğrisinin x ekseni Yanlış Pozitif Oran olduğu için, farklı maliyet rejimlerine atadığı ağırlık sınıflandırıcılar arasında değişir. Dolayısıyla, AUC'yi iki farklı mantıksal regresyonda hesaplarsanız, her iki durumda da "aynı şeyi" ölçmez. Bu, AUC'ye dayalı modelleri karşılaştırmanın çok az anlamlı olduğu anlamına gelir.
El, sabit bir maliyet ağırlıklandırma kullanarak alternatif bir hesaplama önerdi ve buna H-ölçümü dedi - R'de hmeasure
bu hesaplamayı yapacak bir paket var ve karşılaştırma için AUC'ye inanıyorum.
AUC ile ilgili sorunlar hakkında bazı referanslar:
Alıcının çalışma karakteristik eğrisi altındaki alan ne zaman uygun bir sınıflandırma performansı ölçüsüdür? DJ Hand, C. Anagnostopoulos Örüntü Tanıma Harfleri 34 (2013) 492–495
(Bunu özellikle erişilebilir ve kullanışlı bir açıklama olarak buldum)