Güçlü basıklık tahmini?


11

Basıklık için normal tahmin ediciyi kullanıyorum, , ama ampirik dağılımımda küçük 'aykırı değerlerin' bile fark ettim yani merkezden uzak küçük zirveler, onu muazzam bir şekilde etkiler. Daha sağlam bir basıklık tahmincisi var mı?

K^=μ^4σ^4

Yanıtlar:


8

Bir kaç tane var. Bu bağlantıda makalenin açıklanmamış bir versiyonu ile kapsamlı bir karşılaştırma bulacaksınız (bu cevabın altında uygun referans).

Sorunun kısıtlamaları nedeniyle, bu algoritmaların en sağlamının (L / RMC) bozulması en fazla% 12,5'tir. L / RMC'nin bir avantajı, miktarlara dayanması ve temel dağılımın hiçbir anı olmasa bile yorumlanabilir kalmasıdır. Başka bir avantaj, kuyruk ağırlığını ölçmek için verilerin kirlenmemiş kısmının dağılımının simetrisini almamasıdır: aslında, algoritma iki sayı döndürür: sağ kuyruk ağırlığı için RMC ve sol kuyruk ağırlığı için LMC.

Bir tahmin edicinin sağlamlığı, kırılma noktasıyla ölçülebilir. Bununla birlikte, kırılma noktası kavramı bu bağlamda karmaşıktır. Sezgisel olarak, bu tahmincinin rasgele değerler almasını sağlamak için bir rakibin örneğinizin en az% 12,5'ini kontrol etmesi gerektiği anlamına gelir (bu, tahmin edenin kuyruk ağırlığının her zaman yapı olarak : hiçbir kirlenme, örneğin algoritmanın -1'e dönmesine neden olamaz!). Uygulamada, bir kişinin numunenin yaklaşık% 5'ini, tahminlerden en fazla etkilenenlerin (her zaman iki tane vardır) kirlenmemiş örnek üzerinde sahip olduğu değerden çok fazla uzaklaşmasına neden olmadan çok patolojik aykırı değerler ile değiştirilebileceği bulunmuştur.[0,1]

L / RMC de yaygın olarak uygulanmaktadır. Örneğin, burada bir R uygulaması bulabilirsiniz . Yukarıda bağlantılı makalede açıklandığı gibi, L / RMC'yi hesaplamak için, verilerinizin sol ve sağ yarısında MC'yi (bağlantıda uygulanan tahminci) ayrı ayrı hesaplamanız gerekir. Burada, (solda) sağ yarısı, orijinal numunenizin medyanından daha büyük gözlemden oluşan (daha küçük) alt numunelerdir.

  • Brys, Hubert, Struyf. (2006). Kuyruk Ağırlığının Sağlam Ölçüleri.

2
Sözü edilen basurun güçlü basıklık tahmin edicileri yerine bu alternatif kuyruk ağırlığı ölçüleri değil mi? Gerçekten istediği bu olabilir. ama tam olarak istediği bu değil. Bu tahmin edicilerin herhangi biri / tümü büyük numuneler için basıklık yapar mı?
andrewH

Makalenin özeti: Van Zwet'in dışbükey düzenindeki koşulları (bastosis ölçüsünün anlamlı olduğu) doyuran verilerde, basıklığın monoton bir fonksiyonuna yakınsarlar.
user603

1
Pearson basıklık, sade ve basit uçları (nadir görülen aşırı gözlemler) ölçer. Peki bunun yerine ne arıyorsun? Bir "zirve" ölçüsü mü? Birincisi, Pearson'ın basıklığının ölçtüğü şey bu değildir. İkincisi, eğer bir "zirve" ölçüsü istiyorsanız, önce bunun ne anlama geldiğini tanımlamanız gerekir. Eğer tanımlayabilirseniz, tahmin edebilirsiniz. Bir olasılık, zirvede değerlendirilen standart verilerin pdf'sinin ikinci türevidir. (Rica ederim). Eminim başkaları da vardır.
Peter Westfall

1
Aslında, dağılımın kuyruklarıyla kurtozu ilişkilendiren üç matematiksel teorem verdim, bu yüzden bunlar tahrif edilemez: (i) Sonlu dördüncü momentli tüm dağılımlar için kurtoz E (Z ^ 4 * I (| Z |> 1) arasındadır )) ve E (Z ^ 4 * I (| Z |> 1)) +1. (ii) Z ^ 2 yoğunluğunun sürekli ve azaldığı (0,1) alt sınıfta "+1", "+,5" ile değiştirilebilir. (iii) Kurtoz -> sonsuzluğa sahip herhangi bir dağılım dizisi için, E (Z ^ 4 * I (| Z |> b)) / kurtoz -> 1, herhangi bir gerçek b için. Hepsi burada: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Peter Westfall
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.