Arama motorları giderek artan bir şekilde bilgi bekçileri olarak kullanılmaktadır, ancak arama motorları tarafından sonuçları sıralamak için kullanılan kriterler kullanıcılara saygısızdır. Kullanıcılar, arama sonucu kalitesi pahasına bir miktar yarar sağlamak için sonuçlarının önyargısız veya tahrif edilmediğinden nasıl emin olabilirler?
Hükümetler rutin olarak arama sağlayıcılarının politik olarak istenmeyen sayılan web sitelerinin sıralamasını kaldırmasını veya azaltmasını talep ediyor. İşletmeler, gelirlerini artırmak için sağlayıcılara diğerlerine göre belirli sonuçları artırmaları için ödeme yapabilir. Güvenlik duvarları, kullanıcılara geri gönderilmeden önce sonuçlarla karışabilir.
Yüzeyde bulunmayan sıralama algoritmalarında zararsız görünen değişiklikler bile, önyargılı gibi görünebilir, aslında bazı ortak özellikleri (gerçek kalite ile ilgisi olmayan) paylaşan web sitelerine zarar verecek şekilde tasarlanabilir.
Belirli bir süre boyunca sonuçları izleme ve bazı "gizli değişken" (belki de siyasi bir bağlılık) web sitesi sıralamasında değişiklik itici bir faktör olup olmadığını değerlendirerek arama motoru yanlılığını tespit etmek mümkün mü?
Sinsi bir sağlayıcı, zaman içinde hedeflenen web sitelerinin (ve belki de kullanıcıların dikkatini dağıtmak için rastgele web sitelerinin) sıralamasını yavaş yavaş düşürebilir. Bir sağlayıcının algılama olmadan ne kadar önyargı sağlayabileceğinin sınırları nelerdir? Veya bu tür parazitleri, istenen sonucu tesadüfen üreten ağırlıklı sıralama kriterlerini ciddiyetle seçerek ("veri gözetleme" yoluyla) her zaman gizlemek mümkündür.
Sıralama ölçütleri herkese açık hale getirilirse bu değişikliklerden herhangi biri değişir mi? Arama motorlarının kullandığı ölçütleri açık kaynaklı yapmamız gerekiyor mu?
Bu bana bir CDO gibi karmaşık bir finansal aracın satıcı tarafından tahrif edilip edilmediğinin tespit edilmesinin en yoğun alt-problem problemini çözmeye eşdeğer olduğunu hatırlatıyor:
http://www.cs.princeton.edu/~rongge/derivative.pdf
Teşekkürler!