Son zamanlarda çok etiketli sıralama algoritmalarını değerlendirmek için bir metrik seçmek zorunda kaldım ve bu konuya gerçekten yardımcı oldum. İşte bir seçim yapmak için yardımcı olan stpk'nin cevabına bazı eklemeler.
- MAP , yaklaşık etiket maliyetiyle çok etiketli sorunlara uyarlanabilir
- MAP negatif sınıfı baskın olduğunda k de hesaplanması gerekmektedir gerekmez ancak çok etiketli versiyonu adapte olabilir
- MAP ve (N) DCG'nin her ikisi de sıralanmış alaka düzeyi değerlerinin ağırlıklı ortalaması olarak yeniden yazılabilir
ayrıntılar
Ortalama hassasiyet (MAP), çeşitli sorgularda yalnızca ortalama AP'ler olduğundan ortalama hassasiyete (AP) odaklanalım. AP, ikili veriler üzerinde, her bir pozitif öğedeki hassasiyetlerin ortalaması olarak yeniden yazılabilen, hassas hatırlama eğrisinin altındaki alan olarak düzgün bir şekilde tanımlanır. ( MAP hakkındaki wikipedia makalesine bakın ) Olası bir yaklaşım, her birindeki hassasiyetlerin ortalaması olarak tanımlamaktır.öğe. Ne yazık ki, listenin sonunda sıralanan negatif örneklerin AP değeri üzerinde hiçbir etkisi olmadığı güzel özelliğini kaybediyoruz. (Bu, bir arama motorunu olumlu örneklerden çok daha fazla negatif örnekle değerlendirirken üzücüdür. birkaç olumlu örnekle sorgulamak zor.)
Öte yandan, bu yaklaşım çok etiketli durum için iyi genelleştirdiği hoş bir özelliğe sahiptir. Aslında, ikili durumda, k pozisyonundaki hassasiyet, pozitif bir örneğin alaka düzeyinin 1 olduğu ve negatif bir örneğin alaka düzeyinin 0 olduğu k pozisyonundan önceki ortalama alaka olarak da yorumlanabilir. Bu tanım doğal olarak ikiden fazla farklı alaka düzeyi bulunan durum. Bu durumda AP aynı zamanda her bir pozisyondaki alaka düzeylerinin ortalaması olarak da tanımlanabilir.
Bu ifade, yanıtında stpk tarafından belirtilen videonun konuşmacısı tarafından seçilen ifadedir. Bu videoda AP'nin alaka düzeylerinin ağırlıklı bir ortalaması olarak yeniden yazılabileceğini, ağırlığınınk
wAPk=1Klog(Kk)
K
wDCGk=1log(k+1)
Bu iki ifadeden, AP'nin belgeleri 1'den 0'a kadar ağırladığını söyleyebiliriz. - DCG, belgeleri toplam belge sayısından bağımsız olarak tartar.
Her iki durumda da, ilgili örneklerden çok daha alakasız örnekler varsa, pozitifin toplam ağırlığı ihmal edilebilir. AP için bir çözüm, negatif örnekleri alt örneklemektir, ancak alt örnekleme oranının nasıl seçileceğinin yanı sıra sorgunun veya pozitif belge sayısına bağlı olup olmadığından emin değilim. DCG için k'de kesebiliriz, ancak aynı tür sorular ortaya çıkar.
Buradaki herhangi bir kişi bu konuda çalışsaydı, bunun hakkında daha fazla bilgi almaktan memnuniyet duyarım.