Bir tür sorgunuz olduğunu ve geri alma sisteminizin size sorgunuzla en alakalı olduğunu düşündüğü en iyi 20 öğenin sıralı bir listesini döndürdüğünüzü düşünün. Şimdi bunun bir temel-gerçeği olduğunu hayal edin, gerçekte bu 20'nin her biri için "evet" in ilgili bir cevap olduğunu veya "hayır" olmadığını söyleyebiliriz.
Ortalama karşılıklı sıralama (MRR) , bu durumlarda size genel bir kalite ölçüsü verir, ancak MRR yalnızca en üst sıradaki ilgili öğeye önem verir . Sisteminiz üçüncü en yüksek noktada ilgili bir öğeyi döndürürse, MRR'nin önem verdiği budur. Diğer ilgili öğelerin (var olduğu varsayılarak) 4 numara mı yoksa 20 numara mı olduğunu umursamıyor.
Bu nedenle, MRR, (a) yalnızca tek bir ilgili sonuç veya (b) kullanım durumunuzda yalnızca en üst sıralarda yer alan bir sistemi gerçekten önemsediğiniz bir sistemi yargılamak için uygundur. Bu, örneğin kullanıcının tıklamak için sadece bir şey bulmak istediği, başka bir şeye ihtiyaç duymadığı bazı web arama senaryolarında geçerli olabilir. (Bu genellikle doğru olsa da, veya on oldukça iyi cevap döndüren bir web aramasından daha mutlu olur ve bunlardan hangisini tıklayacağınıza dair kendi kararınızı verebilirsiniz ...?)
Ortalama ortalama hassasiyet (MAP) , ilgili öğelerin hepsinin yüksek sıralamada olup olmadığını dikkate alır . Bu nedenle, ilk 20 örnekte, yalnızca 3 numaralı ilgili bir yanıt varsa, bu listedeki tüm "evet" öğelerin yukarı doğru toplanıp toplanmadığı da umurunda değildir.
Veri kümenizde yalnızca tek bir ilgili yanıt varsa, MRR ve MAP , standart MAP tanımı altında tam olarak eşdeğerdir .
Nedenini görmek için, bu blog gönderisindeki örneklerden esinlenen aşağıdaki oyuncak örneklerini göz önünde bulundurun :
örnek 1
Sorgu: "Kaliforniya'nın Başkenti"
Seyahatseverlerin oylaması: "Portland", "Sacramento", "Los Angeles"
Sıralama sonuçları (ikili alaka düzeyi): [0, 1, 0]
Doğru cevap sayısı: 1
Karşılıklı Sıralama:12
Hassasiyet 1: 01
Hassasiyet 2: 12
Hassasiyet 3: 13
Ortalama hassasiyet = .1m∗ 12= 11∗ 12= 0,5
Gördüğünüz gibi, tam olarak bir doğru cevabı olan bir sorgu için ortalama hassasiyet, doğru sonucun karşılıklı sırasına eşittir. Bu tür sorguların bir koleksiyonunun MRR'sinin MAP değerine eşit olacağı sonucuna varılır. Bununla birlikte, aşağıdaki örnekte gösterildiği gibi, birden fazla doğru cevap varsa işler farklılaşır:
ÖRNEK 2
Sorgu: "Kaliforniya'daki Şehirler"
Seyahatseverlerin oylaması: "Portland", "Sacramento", "Los Angeles"
Sıralama sonuçları (ikili alaka düzeyi): [0, 1, 1]
Doğru cevap sayısı: 2
Karşılıklı Sıralama:12
Hassasiyet 1: 01
Hassasiyet 2: 12
Hassasiyet 3: 23
Ortalama doğruluk = .1m∗[12+23]=12∗[12+23]=0.38
Bu nedenle, bu durumda MRR'ye karşı MAP'nin seçimi tamamen ilk doğru vuruştan sonra sıralamanın etkilenmesini isteyip istemediğinize bağlıdır.