Yanıtlar:
Bir kaç tane var. Bu bağlantıda makalenin açıklanmamış bir versiyonu ile kapsamlı bir karşılaştırma bulacaksınız (bu cevabın altında uygun referans).
Sorunun kısıtlamaları nedeniyle, bu algoritmaların en sağlamının (L / RMC) bozulması en fazla% 12,5'tir. L / RMC'nin bir avantajı, miktarlara dayanması ve temel dağılımın hiçbir anı olmasa bile yorumlanabilir kalmasıdır. Başka bir avantaj, kuyruk ağırlığını ölçmek için verilerin kirlenmemiş kısmının dağılımının simetrisini almamasıdır: aslında, algoritma iki sayı döndürür: sağ kuyruk ağırlığı için RMC ve sol kuyruk ağırlığı için LMC.
Bir tahmin edicinin sağlamlığı, kırılma noktasıyla ölçülebilir. Bununla birlikte, kırılma noktası kavramı bu bağlamda karmaşıktır. Sezgisel olarak, bu tahmincinin rasgele değerler almasını sağlamak için bir rakibin örneğinizin en az% 12,5'ini kontrol etmesi gerektiği anlamına gelir (bu, tahmin edenin kuyruk ağırlığının her zaman yapı olarak : hiçbir kirlenme, örneğin algoritmanın -1'e dönmesine neden olamaz!). Uygulamada, bir kişinin numunenin yaklaşık% 5'ini, tahminlerden en fazla etkilenenlerin (her zaman iki tane vardır) kirlenmemiş örnek üzerinde sahip olduğu değerden çok fazla uzaklaşmasına neden olmadan çok patolojik aykırı değerler ile değiştirilebileceği bulunmuştur.
L / RMC de yaygın olarak uygulanmaktadır. Örneğin, burada bir R uygulaması bulabilirsiniz . Yukarıda bağlantılı makalede açıklandığı gibi, L / RMC'yi hesaplamak için, verilerinizin sol ve sağ yarısında MC'yi (bağlantıda uygulanan tahminci) ayrı ayrı hesaplamanız gerekir. Burada, (solda) sağ yarısı, orijinal numunenizin medyanından daha büyük gözlemden oluşan (daha küçük) alt numunelerdir.