Aynı veri kümesine sahip farklı ikili sınıflandırma algoritmaları üzerinde 10 kat çapraz doğrulama yaptım ve hem Mikro hem de Makro ortalamaları aldım. Bunun çok etiketli bir sınıflandırma sorunu olduğu belirtilmelidir.
Benim durumumda, gerçek negatifler ve gerçek pozitifler eşit ağırlıklı. Bu, gerçek negatifleri doğru tahmin etmek, doğru pozitifleri doğru tahmin etmek kadar eşit derecede önemlidir.
Mikro ortalamalı ölçümler, makro ortalamalı ölçümlerden daha düşüktür. İşte bir Sinir Ağı ve Destek Vektör Makinesi sonuçları:
Ayrıca başka bir algoritma ile aynı veri kümesinde yüzde bölme testi yaptım. Sonuçlar:
Yüzde bölünmüş testi makro ortalamalı sonuçlarla karşılaştırmayı tercih ederim, ama bu adil mi? Makro pozitif sonuçların önyargılı olduğuna inanmıyorum, çünkü gerçek pozitifler ve gerçek negatifler eşit ağırlıktadır, ancak daha sonra, bunun elmalarla portakalları karşılaştırmakla aynı olup olmadığını merak ediyorum?
GÜNCELLEME
Yorumlara dayanarak mikro ve makro ortalamaların nasıl hesaplandığını göstereceğim.
Tahmin etmek istediğim 144 etiketim (özellik veya niteliklerle aynı) var. Her etiket için Hassasiyet, Geri Çağırma ve F-Ölçü hesaplanır.
---------------------------------------------------
LABEL1 | LABEL2 | LABEL3 | LABEL4 | .. | LABEL144
---------------------------------------------------
? | ? | ? | ? | .. | ?
---------------------------------------------------
Gerçek pozitifler (tp), gerçek negatifler (tn), yanlış pozitifler (fp) ve yanlış negatifler (fn) esas alınarak hesaplanan ikili değerlendirme ölçüsü B (tp, tn, fp, fn) dikkate alındığında. Belirli bir ölçünün makro ve mikro ortalamaları aşağıdaki gibi hesaplanabilir:
Bu formülleri kullanarak mikro ve makro ortalamalarını aşağıdaki gibi hesaplayabiliriz:
Böylece, mikro ortalamalı ölçümler tüm tp, fp ve fn'yi (her etiket için) ekler, daha sonra yeni bir ikili değerlendirme yapılır. Makro ortalamalı ölçümler, tüm ölçümleri ekler (Hassasiyet, Geri Çağırma veya F-Ölçüm) ve daha çok ortalamaya benzeyen etiket sayısına bölün.
Şimdi soru hangisini kullanacak?