Yüksek pozitif basıklık hipotez testleri için neden sorunludur?


14

Duydum (üzgünüm bir metne bağlantı veremem, bana söylenen bir şey), kalıntıların yüksek pozitif basıklığının doğru hipotez testleri ve güven aralıkları (ve dolayısıyla istatistiksel çıkarım ile ilgili problemler) için sorunlu olabileceğini duydum. Bu doğru mu ve eğer öyleyse, neden? Kalıntıların yüksek pozitif basıklığı, artıkların çoğunun artık ortalamanın yakınında olduğunu ve dolayısıyla daha az büyük artıkların bulunduğunu göstermez mi? (Eğer bir cevabınız varsa, matematiksel olarak eğimli olmadığım için çok fazla matematik içermeyen bir cevap vermeye çalışın).


4
Normal (Gauss) hata terimlerinin ideal koşullarına sahip modellere odaklandığınızı tahmin ediyorum. (Diğer birçok bağlamda, artıkların yüksek basıklığı beklenebilir.) Yüksek basıklık, normalden daha fazla kuyruklu bir dağıtım yağı anlamına gelebilir, bu nedenle bazı çok yüksek (+ veya -) artıklar. Sıfıra yakın birçok kişi olsa bile, bu sadece iyi haberdir ve dikkat edilmesi gereken olası kötü haberdir. Ama sırayla herhangi bir şey anlamına gelebilir. Artık ve takılmış arsa genellikle daha bilgilendiricidir.
Nick Cox

Gerçekten de normallik varsayımlarına sahip modellere odaklanıyordum.
DDK

Yanıtlar:


15

yüksek pozitif rezidüel basıklığın doğru hipotez testleri ve güven aralıkları (ve dolayısıyla istatistiksel çıkarım ile ilgili problemler) için sorunlu olabileceğini duymuşlardır. Bu doğru mu ve eğer öyleyse, neden?

Bazı hipotez testleri için bu doğrudur.

Kalıntıların yüksek pozitif basıklığı, artıkların çoğunun artık ortalamanın yakınında olduğunu ve dolayısıyla daha az büyük artıkların bulunduğunu göstermez mi?

Hayır.

Görünüşe göre varyans kavramını basıklık kavramıyla karıştırıyorsunuz. Varyans daha küçük olsaydı, daha küçük artıklara ve daha az büyük artıklara yönelme eğilimi bir araya gelirdi. Kurtozu değiştirirken standart sapmayı sabit tuttuğumuzu düşünün (bu yüzden kesinlikle varyans yerine kurtozdaki değişikliklerden bahsediyoruz).

Farklı varyansları karşılaştırın (ancak aynı basıklık):

resim açıklamasını buraya girin

farklı basıklık ancak aynı varyansla:

resim açıklamasını buraya girin

( bu yayındaki resimler )

Daha yüksek bir basıklık, varyans sabit tutsanız bile daha büyük kalıntılarla gitme eğilimindedir.

[Ayrıca, bazı durumlarda, küçük kalıntıların konsantrasyonu aslında baktığınız şeylere bağlı olarak en büyük kalıntıların ek kısmından daha fazla soruna yol açabilir.]

Her neyse, bir örneğe bakalım. Bir örneklik t-testi ve örneklem büyüklüğü 10'u düşünün.

Eğer t-istatistiğin mutlak değeri 2.262'den büyük olduğunda sıfır hipotezini reddedersek, o zaman gözlemler bağımsız olduğunda, normal bir dağılımdan aynı şekilde dağıldığında ve varsayılmış ortalama gerçek nüfus ortalaması olduğunda, sıfır değerini reddedeceğiz hipotez zamanın% 5'i.

Normalden çok daha yüksek basıklık ile belirli bir dağılımı düşünün: Nüfusumuzun% 75'i normal bir dağılımdan değerlerini alırken, geri kalan% 25'i 50 kat daha büyük standart sapmalı normal bir dağılımdan değerlerini alır.

Eğer doğru hesaplarsam, bu 12 kurtoza (9 fazla kurtoz) karşılık gelir. Ortaya çıkan dağılım normalden çok daha fazla zirve yapar ve ağır kuyruklara sahiptir. Yoğunluk aşağıdaki normal yoğunluk ile karşılaştırılır - daha yüksek zirveyi görebilirsiniz, ancak sol görüntüde daha ağır kuyruğu gerçekten göremezsiniz, bu yüzden yoğunlukların alt kısmını uzatan yoğunlukların logaritmasını da çizdim. görüntü ve üst sıkıştırır, böylece tepe ve kuyrukları görmek kolaylaştırır.

resim açıklamasını buraya girin

n=10

(Ayrıca, güven aralıklarının kapsamı üzerinde önemli bir etki göreceksiniz.)

Aynı basıklık ile farklı bir dağılımın önem seviyesi üzerinde farklı bir etkisi olacaktır.


Peki ret oranı neden düşüyor? Çünkü daha ağır kuyruk, standart sapma üzerinde ortalamadan biraz daha büyük etkiye sahip birkaç büyük aykırı değerlere yol açar; bu, t-istatistiğini etkiler, çünkü kritik bölgedeki değerlerin oranını azaltan süreçte -1 ile 1 arasında daha fazla t-değerine yol açar.

H0

Sana göstereyim. İşte 10 bedenlik bir örnek:

 1.13 1.68 2.02 2.30 2.56 2.80 3.06 3.34 3.68 4.23

H0:μ=2

Şimdi en büyük değeri 50 yapın:

      1.13 1.68 2.02 2.30 2.56 2.80 3.06 3.34 3.68 50

Açıkça ortalamayı yukarı kaldırıyoruz, bu yüzden öncekinden daha fazla bir fark göstermeli, değil mi? Hayır, hayır. T-istatistik gider aşağı . Şimdi 1.106 ve p değeri oldukça büyük (% 30'a yakın). Ne oldu? Ortalamayı (7.257'ye) çıkardık, ancak standart sapma 15'in üzerine çıktı.

Standart sapmalar, aykırı değerlere araçlardan biraz daha duyarlıdır - bir aykırı değeri koyduğunuzda, tek örnekli t istatistiklerini 1 veya -1'e doğru itme eğilimindesiniz.

Birkaç aykırı değer olasılığı varsa, aynı şey sadece bazen zıt taraflarda olabilir (bu durumda standart sapma daha fazla şişirilirken ortalama bir etki bir aykırı değerle karşılaştırıldığında azalır), yani t-istatistik 0'a yaklaşma eğilimindedir.

Benzer şeyler normallik olduğunu kabul eden bir dizi yaygın testle devam eder - daha yüksek basıklık, daha ağır kuyruklarla ilişkili olma eğilimindedir, bu da daha fazla aykırı anlamına gelir, bu da standart sapmaların araçlara göre şişirildiği ve dolayısıyla almak istediğiniz farklılıkların eğilimi olduğu anlamına gelir. aykırı değerlerin test üzerindeki etkisi ile "gömülmek". Yani, düşük güç.


1
Vay canına, çok net ve ayrıntılı cevap için çok teşekkürler. Zamanınız çok takdir ediliyor!
DDK

Ayrıca, örnek ortalamanın büyük örnek dağılımının basıklığa bağlı olmadığına dikkat etmek gerekir (bu nedenle, ortalamalar için normallik varsayım testlerinin gerçek anlamlılık seviyesi, tipik olarak, .05 olarak n-> olarak nominal seviyeye yakınlaşır. sonsuzluk, tüm sonlu basıklık için), varyans testleri için geçerli değildir. Tahmini varyansın büyük örnek dağılımı basıklığa bağlıdır, bu nedenle kurtosis sıfırdan farklı olduğunda klasik, normallik varsayım testlerinin gerçek anlamlılık seviyesi n -> sonsuz olarak nominal seviyeye yakınlaşmaz.
Peter Westfall

Ayrıca, yüksek basıklık, matematiksel olarak, "ortalamadan daha küçük sapmalar" olduğu anlamına gelmez. Size kesin olarak söylediği tek şey, kuyrukta daha fazlası olduğu.
Peter Westfall

Daha küçük sapmalar yapmazsanız daha büyük sapmalar elde edemez ve varyansı sabit tutamazsınız ; eğer varyansı sabit tutmazsanız, sapmalarınızın daha fazlası yeni skalaya göre küçük olur. Yani evet, söz konusu basıklık söz konusu olduğunda, matematik size daha büyük olanın daha küçük taşıdığını söyler.
Glen_b

ZXκ=E(Z4)κ1=E(Z2)κZVar(Z)=1Xμ±kσkXXZ

4

Basıklık aykırı değerleri ölçer. Aykırı değerler, normal dağılıma dayanan standart çıkarımlar için (örn., T-testleri, t-aralıkları) sorunludur. Hikayenin sonu bu! Ve bu gerçekten oldukça basit bir hikaye.

Bu hikayenin iyi anlaşılmamasının nedeni, basıklığın "doruk noktası" ölçtüğü kadim mitin devam etmesidir.

İşte basıklığın neden "dorukluk" değil aykırı değerleri ölçtüğünü gösteren basit bir açıklama.

Aşağıdaki veri kümesini göz önünde bulundurun.

0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1

Basıklık (z-değerleri) ^ 4'ün beklenen değeridir. İşte (z-değerleri) ^ 4:

6.51, 0.30, 5.33, 0.45, 0.00, 0.30, 6.51, 0.00, 0.45, 0.30, 0.00, 6.51, 0.00, 0.00, 0.30, 0.00, 27.90, 0.00, 0.30, 0.45

Ortalama 2.78'dir ve bu basıklık için bir tahmindir. (Aşırı basıklık istiyorsanız 3 çıkarın.)

Şimdi, son veri değerini 999 ile değiştirin, böylece bir aykırı değer olur:

0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999

Şimdi, (z-değerleri) ^ 4:

0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00.0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 360.98

Ortalama 18.05'tir ve bu basıklık için bir tahmindir. (Aşırı basıklık istiyorsanız 3 çıkarın.)

Açıkçası, sadece aykırı değerler önemlidir. "Zirve" veya orta noktaya yakın veriler hakkında hiçbir şey yok.

İkinci veri kümesiyle standart istatistiksel analizler yaparsanız, sorun beklemelisiniz. Büyük basıklık sizi sorun konusunda uyarır.

İşte ayrıntılı bir makale:

Westfall, PH (2014). Dorukluk olarak Kurtosis, 1905 - 2014. RIP Amerikan İstatistikçisi, 68, 191-195.


Neden sadece parametrik olmayan testleri kullanmıyorsunuz? Bu tür sorunlar için daha üstün olmaları muhtemeldir.
Carl

1
Anlaşıldı, bu olası bir yol, eğer test etmeyi seviyorsanız, klasik formunda hızla daha az ilginç hale geliyor. Ama bu benim endişem değil. Genel olarak olasılıksal modelleme ile daha çok ilgileniyorum. Bir uygulama: Belki ortalamaya gerçekten ilgi duyuyorsunuz, örneğin, bağımlı değişkenin kazanılan dolar olduğu durumlarda, süreç ortalaması süreç medyanından daha ilginçtir. Peki, veriler, aykırı değerlere eğilimli olduğunda işlem hakkında ne söylüyor? Bu zor bir sorun, ama önemli bir sorun ve an basan basıklık cevap ile ilgilidir. Parsel olmayan testler değil.
Peter Westfall

Cauchy dağılımı için, kesilen ortalama, konumun medyandan daha iyi bir ölçüsü olabilir ve normal ortalama, konumun bir ölçüsü olmayacaktır. Konum ölçüsü olarak ne kullanılacağı, dağıtımın ne olduğuna bağlıdır. Kurtozun bir gösterge olarak yardımcı olmayacağı bir örnek, ortalama aşırı değerin, hem medyandan hem de ortalamadan daha iyi bir konum ölçüsü olduğu tek tip dağılımdır.
Carl

Mesele değil. Toplamlarla, örneğin dolarlarla ilgileniyorsanız, normal ortalama, istediğiniz konumun ölçüsüdür.
Peter Westfall

Cauchy dağıtılmış bir değişkeniniz varsa, kazanılan toplam dolar için bir dava oluşturabilirsiniz, ancak ortalama, "beklenen değerin" kendisiyle ilişkili makul bir beklentisi olmadığı anlamına gelen özellikle kullanışlı bir yer ölçüsü olmayacaktır.
Carl

-3

Kurtoz ayrıca asimetrik kuyrukları gösterir. İki kuyruklu bir hipotez testinde, bir kuyruk uzun bir kuyruk ve diğeri kısa bir kuyruk olacaktır. Kuyruklardan biri alfa, ancak <beta olabilir. Bir kuyruk p değerini geçecek, diğeri geçmeyecekti.

Temel olarak, istatistiksel çıkarım standart bir normale bürünür. Standart bir normal olmadığında, bazı daha karmaşık çıkarım mekaniğine dayanan bir çıkarımla karşılaşabilirsiniz. Poisson çıkarımını bize yapabilirsiniz, ancak normal olmayan bir dağılımla, normallere dayanan çıkarım kullanamazsınız.

Çarpıklık ve basıklık normallik dışı bir ölçüttür. Normalliği test etmemiz gerektiğini bilmeden önce, normal dağılımları anlamayı ve kullanmayı öğreniriz. Normal, her boyuttan 36 veya daha fazla veri noktası gerektirir. 20 veri noktasında tahmin yapabilirsiniz, ancak yine de çarpıklık ve basıklık olacaktır. Dağıtım normalliğe yaklaştıkça, çarpıklık ve dağılım kaybolur.

Açıklamalardan biri basıklığı doruk noktası olarak tanımladı. Başka biri olmadı. Bu şu anda huzursuz bir mücadele. Basıklık dördüncü an, bir alandır. Ben sorunun zirvesinde değilim.

Orada olan bir başka fikir, eğriltme ile medyanın bir üçgen oluşturan moda eğildiğidir. Zevk almak.


1
Bunun zaten mükemmel cevaplara faydalı ve farklı bir şey kattığı açık değil. Örneğin, "normal 36 veya daha fazla veri noktası gerektirir" gibi pek çok şaşırtıcı ifade ekler (bu yüzden 35 TAMAM değil mi? Bu iddianın temeli nedir? " standart normal ": genel olarak değil. Kürtoz dördüncü moment, bir alan: hayır; burada tanımlandığı gibi basıklık, ortalama dördüncü ve ikinci momentlere dayanan boyutsuz bir orandır.
Nick Cox

Dördüncü an bir integraldir, bu yüzden bir alandır. Bu alanın zirveye veya eğriliğe nasıl çevrildiği üzerimde kayboluyor.
David W. Locke

Tipik basıklık açıklaması zirve noktasıdır, ama bence bu yanlış. Ben basıklık dediği için dorukluk olarak çarpıklığı değiştirmek için orijinal yanıtımı düzenleyeceğim ... Teşekkürler.
David W. Locke

Kuyruklar simetrik değildir. Asimetik kuyrukları dikkate alan istatistiksel çıkarım hakkında hiçbir şey görmedim. Basıklık riski, daha fazla veri noktası toplandıkça kuyrukların hareket etmesi nedeniyle olur. Çarpıklık ve basıklık, standart bir normale ulaşmak için yeterli veriye sahip değildir.
David W. Locke

1
Öyle değil: üstel, gama, Weibull ve normal olmayan birçok başka dağıtım için bir dizi teori ve uygulama var.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.