Uygulamalı bir istatistik dersinde basıklık öğretmeli miyiz? Öyleyse nasıl?


17

Merkezi eğilim, yayılma ve çarpıklık en azından sezgisel olarak nispeten iyi tanımlanabilir; Bunların standart matematiksel ölçümleri de sezgisel görüşlerimize nispeten iyi karşılık gelir. Ancak basıklık farklı görünüyor. Çok kafa karıştırıcı ve dağıtım şekli ile ilgili herhangi bir sezgi ile iyi uyuşmuyor.

Uygulanan bir ortamda basıklığın tipik bir açıklaması, Microsoft Excel kullanarak iş ve yönetim için Uygulamalı istatistiklerden elde edilen bu alıntıdır [ 1 ] :[1]

Basıklık, bir dağılımın ne kadar zirve yaptığı veya tam tersine ne kadar düz olduğu anlamına gelir. Kuyruklarda normal bir dağılımdan beklediğinizden daha fazla veri değeri varsa, basıklık pozitiftir. Tersine, kuyruklarda normal bir dağılımda beklediğinizden daha az veri değeri varsa, basıklık negatiftir. En az dört veri değeriniz yoksa Excel bu istatistiği hesaplayamaz.

"Basıklık" ve "aşırı basıklık" arasındaki karışıklık dışında (bu kitapta olduğu gibi, eski kelimeyi başkalarının yazarının ikincisine ne dediğini belirtmek için kullanmak yaygındır), "dorukluk" veya "düzlük" açısından yorumlama daha sonra kuyrukta kaç veri öğesinin olduğuna dikkat çekilerek karıştırılır. Hem "tepe" hem de "kuyruk" dikkate alındığında - Kaplansky [ 2 ][2]1945 yılında, zamanın birçok ders kitabında basıklığın hatalı olduğunu, dağılımın tepe noktasının kuyrukları dikkate almadan normal bir dağılımınki ile ne kadar yüksek olduğu ile ilgili olduğunu belirtti. Ancak, şekli hem zirvede hem de kuyruklarda düşünmek açıkça sezgiyi kavramayı zorlaştırır, yukarıda belirtilen özütün, zirveden kuyrukların ağırlığına kadar bu kavramlar sanki gibi atlayarak atladığı bir nokta.

Dahası basıklığın bu klasik "tepe ve kuyrukları" açıklaması sadece simetrik ve tek modlu dağılımlar için iyi sonuç verir (aslında, bu metinde gösterilen örneklerin hepsi simetriktir). Yine de "doruk", "kuyruk" veya "omuzlar" açısından basıklığı yorumlamanın "doğru" genel yolu on yıllardır tartışılmaktadır . [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ][2][3][4][5][6]

Uygulamalı bir ortamda basıklık öğretmenin daha titiz bir yaklaşım uygulandığında çelişkilere veya karşı örneklere çarpmayacak sezgisel bir yolu var mı? Basıklık, matematiksel istatistik sınıflarının aksine, bu tür uygulamalı veri analizi dersleri bağlamında bile yararlı bir kavram mıdır? Eğer bir dağılımın "doruk noktası" sezgisel olarak yararlı bir kavramsa, bunu L-momentleri [ 7 ] ile öğretmeli miyiz ?[7]

Herkenhoff, L. ve Fogli, J. (2013). Microsoft Excel kullanarak iş ve yönetim için uygulanan istatistikler. New York, NY: Springer.[1]

Kaplansky, I. (1945). "Basıklık ile ilgili yaygın bir hata". Amerikan İstatistik Derneği Dergisi,40(230): 259.[2]

Darlington, Richard B (1970). "Kurtoz Gerçekten 'Zirve' midir?". Amerikan İstatistikçi24(2): 19–22[3]

Moors, JJA. (1986) "Basıklık anlamı: Darlington yeniden incelendi". Amerikan İstatistikçi40(4): 283-284[4]

Balanda, Kevin P. ve MacGillivray, HL (1988). "Kürtoz: Eleştirel Bir İnceleme". Amerikan İstatistikçi 42(2): 111–119[5]

DeCarlo, LT (1997). "Basıklık anlamı ve kullanımı üzerine". Psikolojik yöntemler,2(3), 292. Chicago[6]

Hosking, JRM (1992). "Momentler veya L momentler? İki dağılım şekli ölçüsünü karşılaştıran bir örnek" Amerikan İstatistikçi46(3): 186-189[7]


2
Her zamanki müfredatla ne demek istiyorsun? Yani hangi eğitim seviyesi.
Gumeo

5
Basıklık hakkında tam olarak ne öğretiyorsunuz? Bu soru olduğu gibi oldukça belirsiz. Lütfen şimdi müfredatınıza nasıl uyduğunu ve belki de katılıma karşı çelişen standart önlemlerden bazı sezgisel örnekleri doldurun.
John

3
Basıklık moment ölçüsünün aslında bu açıdan moment çarpıklığından çok farklı olduğunu düşünmüyorum. Her iki durumda da insanların yaptıklarını gerçekten yansıtmıyorlar ve her ikisi de insanların kendileri hakkında anlattıkları hikayelerden daha az sezgisel. Basıklık ile ilgili her şaşırtıcı karşı örnek için, çarpıklık hakkında bir tane daha var. İkisini de kaldırmazdım, ama şu andaki önlemlere yapılan vurguyu azaltacağım, daha sonra hareket ettireceğim ve öğretildiklerini değiştirirdim, böylece farklı kavramları birleştirmeyiz ve biz dayanmayan iddialarda bulunun.
Glen_b-Monica Monica

3
Daha yüksek çarpıklık , çarpıklık yönünde daha ağır bir kuyruk anlamına gelmez. Sıfır çarpıklık simetri anlamına gelmez (sıfırın tüm tuhaf anları simetri anlamına gelmez). Simetri sıfır çarpıklık anlamına gelmez. Hangi sezgiler kaldı?
Glen_b-Monica Monica

3
İşte ilginç bir örnek sınıfı olan tartışmalarla ilgili başka bir cevap. Başkaları da var ama onları şu anda görmüyorum. Whuber'ın gönderilerinden bazıları da faydalıdır.
Glen_b

Yanıtlar:


18

Kurtoz gerçekten çok basit ... ve kullanışlıdır. Sadece aykırı değerlerin veya kuyrukların bir ölçüsüdür. Zirveyle hiçbir ilgisi yoktur - bu tanımın terk edilmesi gerekir.

İşte bir veri kümesi:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999

'999'un bir aykırı değer olduğuna dikkat edin.

Veri kümesindeki değerleri şunlardır :z4

0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00.0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 360.98

Sadece aykırı değer, 0'dan belirgin şekilde farklı bir verdiğine dikkat edin.z4

Bu değerlerinin ortalaması ampirik dağılımın basıklığıdır (isterseniz 3 çıkarın, yaptığım nokta için önemli değil): 18.05z4

Bu hesaplamadan, "zirve" ye yakın verilerin (aykırı olmayan veriler) basıklık istatistiğine neredeyse hiçbir şey katmadığı açıktır.

Basıklık, aykırı değerlerin bir ölçüsü olarak yararlıdır. Aykırı değerler ilkokul öğrencileri için önemlidir ve bu nedenle basıklık öğretilmelidir. Ancak basıklık, sivri, düz, bimodal veya sonsuz olsun, zirveyle neredeyse hiçbir ilgisi yoktur. Yukarıdakilerin hepsine küçük basıklık ve yukarıdakilerin hepsine büyük basıklık olabilir. Bu yüzden ASLA zirveyle ilgili bir şey olduğu düşünülmemelidir, çünkü bu yanlış bilgi öğretecektir. Ayrıca malzemeyi gereksiz yere kafa karıştırıcı ve görünüşte daha az kullanışlı hale getirir.

Özet:

  1. basıklık, kuyrukların (aykırı değerler) ölçüsü olarak yararlıdır.
  2. basıklık tepe ile ilgisi yoktur.
  3. basıklık pratik olarak faydalıdır ve öğretilmelidir, ancak sadece aykırı değerlerin bir ölçüsü olarak. Basıklık öğretirken zirveden bahsetmeyin.

Bu makalede "Peakedness" tanımının neden resmen öldüğünü açıklıyor.

Westfall, PH (2014). " Zirve Olarak Kurtosis, 1905 - 2014. RIP " Amerikan İstatistikçisi , 68 (3), 191–195.


4
CV'ye hoş geldiniz, umarım etrafta dolaşırsınız ve gelecekte daha fazla katkıda bulunursunuz! Yazınızı, makaleye bir bağlantı içerecek şekilde düzenledim ve bazı matematik notasyonunu yeniden biçimlendirdim, umarım umursamazsınız. ( $Örneğin bir matematik yerleştirerek L$z^4$ kullanmak mümkündür. )LATEX
Silverfish

6

Soru biraz belirsiz olsa da, ilginç. Basıklık hangi seviyelerde öğretilir? Doğrusal modellerde (yüksek lisans düzeyinde) bir derste (uzun zaman önce Seber'in kitabının ilk baskısına dayanarak) bahsedildiğini hatırlıyorum. Önemli bir konu değildi, ancak (hafızadan) doğru seviyenin asimptotik olarak aynı kurtoza sahip olmasına bağlı olarak, varyansların eşitlik olasılığı testinin (F-testi) sağlamlığını (eksikliği) incelemek gibi konulara giriyor. varsaymak için çok fazla normal dağıtım! Oja'nın çarpıklık, basıklık ve gerçekten neyin gerçekten ölçtüğünü bulmaya çalışan bir makale gördük (ancak detayları ile hiç okumadım) http://www.jstor.org/stable/4615828?seq=1#page_scan_tab_contents .

Bunu neden ilginç buluyorum? Çünkü Latin Amerika'da öğretiyorum, burada çarpıklık ve basıklık çok önemli konular tarafından öğretiliyor ve lisansüstü öğrencilere (ekonomiden çok sayıda) basıklığın dağıtımın kötü bir ölçüsü olduğunu söylemeye çalışıyorum (esas olarak çünkü dördüncü güçlerin örnekleme değişkenliği çok büyüktür), zordu. Bunun yerine QQplots kullanmaya başladım. Yani, bazı yorumculara, evet, bu muhtemelen bir çok yere öğretilir !

Bu arada, bu sadece benim düşüncem değil. Aşağıdaki blog yazısı https://www.spcforexcel.com/knowledge/basic-statistics/are-skewness-and-kurtosis-useful-statistics bu alıntıyı içeriyor (Dr. Wheeler'a atfedilmiştir):

Kısacası, çarpıklık ve basıklık pratik olarak değersizdir. Shewhart bu gözlemi ilk kitabında yaptı. Çarpıklık ve basıklık istatistiği, yer ve dağılım önlemleri tarafından halihazırda verilen bilgilerin ötesinde herhangi bir yararlı bilgi sağlamaz.

Dağılım biçimlerini incelemek için daha iyi teknikler öğretmeliyiz! QQ grafikleri (veya bağıl dağılım grafikleri) gibi. Ve eğer birisi hala sayısal önlemlere ihtiyaç duyuyorsa, L-momentlerine dayanan önlemler daha iyidir. JRM Hosking'in JR Statist Soc B (1990) 52, No 1, s.105-124 makalesinden bir pasaj önereceğim: "L-momentler: Sipariş İstatistiklerinin Doğrusal Kombinasyonu Kullanılarak Dağılımın Analizi ve Tahmini", sayfa 109:

λ1λ2μ(F)12σ1(F)τ3τ4

(Şu an için, bu önlemlerin tanımları için makaleye atıfta bulunuyorum, hepsi L-anlarına dayanıyor.) İlginç olan şey, dördüncü anlara dayanan geleneksel basık ölçüsünün basıklık ölçüsü olmamasıdır . Oja anlamında! (Bu iddiayı bulabildiğim zaman referanslarda düzenleyeceğim).


1
Dağılım özelliklerini anlamak için grafiksel ve diğer tekniklerin kullanımıyla ilgili bir sorun yoktur, ancak "çarpıklık ve basıklık pratik olarak değersizdir" ifadesi abartıdır. Her ikisinin de her türlü istatistiksel çıkarım üzerinde büyük etkileri vardır.
Peter Westfall

@Peter Muhtemelen bu ifadede "ampirik basıklık" anlamına geliyordu.
kjetil b halvorsen

1
Buna rağmen, ampirik basıklık, verilerinizde ne zaman bir dış probleminiz olduğunu söyler. Bu yüzden hala "çarpıklık ve basıklık değersizdir" yorumunun abartı olduğunu düşünüyorum. Elbette, özellikle daha küçük örneklem büyüklüklerinde "popülasyon" parametrelerinin büyük tahminleri olmayabilir, ancak "pratik olarak değersiz" bir esnektir. Popülasyon parametrelerini özellikle iyi tahmin etmese bile, mevcut veri seti hakkında hala yararlı tanımlayıcı bilgiler sağlarlar. Elbette qq grafikleri gibi grafiksel görünümlerle desteklenmesi gereken bilgiler.
Peter Westfall

@Peter Westfall: Gerçek Q, belki de ampirik basıklık, aykırı sorunları tespit etmek için en iyi önlemse veya daha iyi bir şey varsa?
kjetil b halvorsen

Ampirik basıklık, bireysel aykırı değerleri değil, bir veri kümesinin aykırı karakterini ölçer. Kurtosis = 3'ün (normal gibi) "aykırı değer yok" anlamına geldiği kadar ileri gitmezdim, ancak böyle bir durumun, her biri dördüncü sıraya alınan ortalama z değeriyle ölçüldüğü anlamına gelir. güç) normal dağılımınkine benzer. Öte yandan, büyük bir basıklık kesinlikle daha aykırı bir sorunu gösterir. Evet, normal qq grafikleri daha rafine tanı için daha iyidir. BTW, normal qq grafiği ve fazla basıklık sıkı bir matematiksel bağlantıya sahiptir.
Peter Westfall

3

Bence, çarpıklık katsayısı terimleri motive etmek için yararlıdır: olumlu eğri ve negatif eğri. Ancak, hedefiniz normalliği değerlendirmekse, burada durur. Klasik çarpıklık ve basıklık ölçüleri genellikle normallikten farklı sapma türlerini yakalayamaz. Öğrencilerime genellikle qq-grafiği veya normal olasılık grafiği gibi normalliği değerlendirmenin makul olduğunu değerlendirmek için grafik teknikleri kullanmayı savunuyorum. Ayrıca yeterli boyutta bir örnekle, bir histogram da kullanılabilir. Boxplotlar aykırı değerleri ve hatta ağır kuyrukları tanımlamak için de yararlıdır.

Bu, APA'nın 1999 görev gücü önerileri ile aynıdır:

" Varsayımlar. Veriler göz önüne alındığında, analiz için gerekli temel varsayımların makul olduğundan emin olmak için çaba göstermelisiniz. Kalıntıları dikkatle inceleyin. Dağılım testlerini ve istatistiksel şekil indekslerini (örneğin, çarpıklık, basıklık) kalıntılarınızın grafiksel olarak incelenmesinin yerine kullanmayın. Model uydurma problemlerini teşhis etmek için istatistiksel test kullanmanın bazı eksiklikleri vardır. İlk olarak, özet istatistiklere dayanan (varyans homojenliği testleri gibi) tanısal anlamlılık testleri genellikle pratik değildir; istatistiksel model testlerimiz, istatistiksel varsayım testlerimizden daha sağlamdır. İkincisi, çarpıklık ve basıklık gibi istatistikler genellikle artıklardaki dağılımsal düzensizlikleri tespit edemez. Üçüncüsü, istatistiksel testler örneklem büyüklüğüne bağlıdır ve örneklem büyüklüğü arttıkça, testler genellikle zararsız varsayımları reddeder. Genel olarak, varsayımların grafiksel analizinin yerini tutamaz."

Referans: Wilkinson, L. ve İstatistiksel Çıkarımda Görev Gücü. (1999). Psikoloji dergilerinde istatistiksel yöntemler: Yönergeler ve açıklamalar. Amerikalı Psikolog, 54, 594-604.


1

Kursun ne kadar uygulandığına bağlı olarak, tahminlerin doğruluğu sorunu ortaya çıkabilir. Varyans tahmininin doğruluğu güçlü bir şekilde basıklık üzerine bağlıdır. Bunun olmasının nedeni, yüksek basıklık ile dağılımın nadir, aşırı potansiyel olarak gözlemlenebilir verilere izin vermesidir. Bu nedenle, veri oluşturma süreci bazı örneklerde çok uç değerler üretecek, diğerlerinde çok uç değerler üretmeyecektir. İlk durumda, çok büyük bir varyans tahmini ve ikincisinde küçük bir varyans tahmini alırsınız.

Eğer modası geçmiş ve yanlış "zirve" yorum ortadan kaldırılmış ve odak tamamen aykırı (yani, nadir, aşırı gözlemlenebilir) verilen, o zaman giriş kurslarında basıklık öğretmek daha kolay olurdu. Fakat insanlar kendilerini "doruk noktasına" haklı göstermeye çalışan düğümlere büküyorlar, çünkü (yanlış) ders kitaplarında bu şekilde ifade ediliyorlar ve basıklıkların gerçek uygulamalarını kaçırıyorlar. Bu uygulamalar çoğunlukla aykırı değerlerle ilgilidir ve tabi ki aykırı değerler uygulamalı istatistik derslerinde önemlidir.


1
Bu konudaki en upvoted cevabının yazarı ile aynı Peter Westfall siz misiniz? Öyleyse, profillerinizin birleştirilmesini sağlayabilir ve ardından başka bir yanıt göndermek yerine eski cevabınızı doğrudan düzenleyebilirsiniz.
amip diyor Reinstate Monica

1
Evet, netiquette'i kaçırdığım için üzgünüm.
Peter Westfall

-1

Açıkçası, insanların neden basit şeyleri karmaşıklaştırmak istediklerini anlamıyorum. Neden sadece tanımı göstermiyoruz ( Wikipedia'dan çalındı ):

Kurt[X]=E[(Xμσ)4]=μ4σ4=E[(Xμ)4](E[(Xμ)2])2,

You can replace the expectation operator with sum based estimators 1ni=1n, of course. It helps to discuss the units of measure of μ,σ2,μ4, and show why the fourth moment should be scaled by the square of the variance to make kurtosis the dimensionless measure, i.e. a shape parameter. So, we have now location μ, scale σ2 and any number of parameters to describe the shape such as skew and kurtosis. I'd always start with equations. Supposedly easy to understand explanations in plain English only make everything more confusing. Verbosity clarity.


1
The problem is that, once you get the kurtosis, it's very unintuitive what (if anything) it means. It doesn't match up with useful qualities of the distribution.
Peter Flom - Reinstate Monica

Yes, kurtosis does match with a very useful quality of a distribution - it is a measure of tailweight (outliers). Supporting mathematical theorems, for which there is no counterexample: (i) kurtosis is between E(Z^4 *I(|Z| >1)) and E(Z^4 *I(|Z| >1)) + 1, for all distributions having finite 4th moment. (ii) for the subclass of continuous distributions where the density of Z^2 is decreasing on (0,1), kurtosis is between E(Z^4 *I(|Z| >1)) and E(Z^4 *I(|Z| >1)) + .5, and (iii) for any sequence of distributions with kurtosis tending to infinity, E(Z^4 *I(|Z| >b))/kurtosis ->1, for every real b.
Peter Westfall
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.