Bir dağılımın basıklığı, yoğunluk fonksiyonunun geometrisi ile nasıl ilişkilidir?


12

Basıklık, bir dağılımın dorukluğunu ve düzlüğünü ölçmektir. Varsa, dağılımın yoğunluk fonksiyonu bir eğri olarak görülebilir ve şekliyle ilgili geometrik özelliklere (eğrilik, dışbükeylik, ...) sahiptir.

Bir dağılımın basıklığının, kurtozun geometrik anlamını açıklayabilen yoğunluk fonksiyonunun bazı geometrik özellikleri ile ilişkili olup olmadığını merak ediyorum.


Formülde yoğunluk eğrisinin bazı geometrik miktarları ile ilişki kurmak istiyorum, sadece yazıma işaret ettiğim belirsiz anlamlarla değil. Ya da basıklığın neden geometrik anlamı olduğuna dair bir açıklama yapmakta fayda var
Tim

@Peter Bu gerçek olmaktan uzak. PDF grafiğinin geometrisi, herhangi bir belirlenmiş (sonlu sayıda) anı değiştirmeden neredeyse keyfi olarak değiştirilebilir.
whuber

Stats.stackexchange.com/questions/25010/… adresindeki yakından ilgili soru, bu soruya doğru cevabın ne olması gerektiğini önermektedir.
whuber

@whuber katılıyorum ve bu örnek için teşekkür ederken, aynı zamanda pdf ailesinin olağanüstü özelliği hakkında genel olarak basıklıktan daha fazla şey söylemediğini merak ediyorum.
user603

@ user603 Merak etmek iyi bir şey. Bununla birlikte, ifade bu özel aile ile ilgili değildir: sadece lognormal dağılım için aynı anlara sahip alternatif PDF sınıfının açık bir temsilini üretebilir. O ise bu özel tüm anları aynıdır, ancak bunların anları düzeltmeleri sonlu sayı zor değildir bir şekilde en dağılımlarını rahatsızlık vermesini. (Bernoulli gibi belirli ayrık dağıtımlar için zordur, ancak PDF'leri yoktur.)
whuber

Yanıtlar:


17

Sürekli dağılım anları ve basıklık gibi işlevleri, yoğunluk fonksiyonunun grafiği hakkında çok az şey anlatır.

Örneğin, aşağıdaki grafikleri düşünün.

resim açıklamasını buraya girin

Bunların her biri bütünleşen negatif olmayan bir fonksiyonun grafiğidir : hepsi PDF'dir. Dahası, hepsi tamamen aynı anlara sahiptir - her sonsuz sayıda. Böylece ortak bir basıklık paylaşırlar (bu eşittir - 3 + 3 e 2 + 2 e 3 + e 4) .13+3e2+2e3+e4

Bu işlevler için formüller

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

için - 1 s 1 , ve k Z .x>0, 1s1,kZ.

Şekilde solda değerleri ve üstte k değerleri gösterilmektedir . Sol sütunda standart lognormal dağılımın PDF'si gösterilmektedir.sk

Kendall'ın İleri İstatistik Teorisi'nde (Stuart & Ord, 5. baskı) 6.21 alıştırması okuyucudan bunların hepsinin aynı anlara sahip olduğunu göstermesini ister.

Benzer şekilde, herhangi bir pdf, radikal olarak farklı bir şekilde başka bir pdf oluşturmak için değiştirilebilir , ancak aynı ikinci ve dördüncü merkezi momentlere (diyelim ki), bu nedenle aynı basıklığa sahip olacaktır. Sadece bu örnekten, basıklığın kolayca yorumlanabilir veya sezgisel bir simetri, kararsızlık, iki boyutlu, dışbükeylik veya bir eğrinin bilinen herhangi bir geometrik karakterizasyonu olmadığı açıktır.

Bu nedenle momentlerin işlevleri (ve özel bir vaka olarak basıklık) pdf grafiğinin geometrik özelliklerini tanımlamaz. Bu sezgisel olarak mantıklıdır: Bir pdf olasılığı alan yoluyla temsil ettiğinden , önceden belirlenmiş anların sonlu sayısını düzeltirken, olasılık yoğunluğunu bir konumdan diğerine neredeyse serbestçe kaydırabiliriz.


1
"Sadece bu örnekten, bir eğrinin diğer bilinen geometrik karakterizasyonu çok açık olmalıdır." Ne demek istediğini anlıyorum, ama buradaki yorumda makul bir farklılık var. Başka bir yorum, simetrik bir dağılımdan başlayarak, belirli bir noktada bir miktar kütleyi hareket ettirmenin basıklığı nasıl arttırdığını / azalttığını gösteren Darlington'dur (yine, örneğinizin bir çelişkisi değil, sadece daha 'olumlu' bir anlayış).
user603

1
@ user603 Katılmıyorum, ancak "olumlu" yaklaşımın, çalışması için örtük olarak yapılan çok özel varsayımlara baktığını düşünüyorum. Ayrıca çarpıklığı sıfır olan (oluşturmak zor olmayan) son derece asimetrik bir PDF'nin grafiği ile başlayabilir. Böylece bu olumlu yaklaşım sadece kütle taşındığında bazı çok özel PDF'lere ne olduğunu açıklar. Her ne kadar bu sezgi için oldukça yararlı olsa da, bu soru üzerinde mantıklı bir etkisi yok gibi görünüyor.
whuber

1
Çarpıklığı (ve genel olarak cevabınızı) kabul ediyorum. Ancak bir fonksiyon olarak basıklık minimumdur. Bu, işleri biraz daha ilginç hale getirir.
user603

1
@ user603 Teşekkür ederim; bu anlayışlı bir ayrım. Mevcut sonuçların hiçbirini önemli şekillerde değiştirdiğini düşünmüyorum ama kesinlikle sezgiye yardımcı oluyor ve çift ve tek anlar arasında önemli bir farklılığa işaret ediyor.
whuber

6

Simetrik dağılımlar için (hatta ortalanmış anların anlamlı olduğu durumlar) basıklık, altta yatan pdf'nin geometrik bir özelliğini ölçer. Basıklığın bir dağılımın doruk noktasına kadar ölçtüğü (veya genel olarak ilişkili olduğu) doğru değildir. Aksine basıklık, altta yatan dağılımın simetrik ve bimodal olmaktan ne kadar uzak olduğunu ölçer (cebirsel olarak, mükemmel simetrik ve bimodal bir dağılım, basıklığın sahip olabileceği en küçük değer olan 1 basıklığa sahip olacaktır) [0].

Özetle [1], eğer tanımlarsanız:

k=E(xμ)4/σ4

E(X)=μ,V(X)=σ2

k=V(Z2)+11

Z=(Xμ)/σ

kZ2

[0] RB Darlington (1970). Kurtoz Gerçekten “Dorukluk” mu? Amerikan İstatistikçi, Cilt. 24, No. 2.

[1] JJA Moors (1986) Kurtosis'in Anlamı: Darlington Yeniden İncelendi. Amerikan İstatistikçi, Cilt 40, Sayı 4.


1
Her yere "bimodal" yazıyorsunuz belki de "unimodal" demek istiyor musunuz?
whuber

1
fμg(x)=(f(x)+f(2μx))/2.g1. Böylece, en azından, basıklık bimodalite hakkında hiçbir şey söylemez. Olmadığı için, pdf'nin hangi geometrik özelliğini tam olarak açıklıyor?
whuber


1
Basıklık, iki nokta ile eşdeğer karıştırılabilir dağılıma benzer bir şey gösterdiğinde, minimum değerine yakın olduğu aşırı durum haricinde, bimodaliteyi göstermez. Mümkün olan her basık değerde bimodal dağılımınız olabilir. Örnekler için ncbi.nlm.nih.gov/pmc/articles/PMC4321753 adresine bakın .
Peter Westfall

1
ppv0

5

[Not: Bu, sitedeki başka bir soruya yanıt olarak yazılmıştır; cevaplar mevcut soru ile birleştirildi. Bu cevabın farklı bir şekilde ifade edilen bir soruya yanıt vermesinin nedeni budur. Ancak yazının büyük kısmı burada alakalı olmalıdır.]

Kurtoz, dağılımların şeklini gerçekten ölçmez. Bazı dağıtım ailelerinde, şekli tanımladığını söyleyebilirsiniz, ancak daha genel olarak basıklık size gerçek şekil hakkında çok fazla şey anlatmaz. Şekil, basıklık ile ilgisi olmayan şeyler de dahil olmak üzere birçok şeyden etkilenir.

Eğer görüntü basıklık için arama yaparsa, bunun gibi birkaç görüntü görünür:

p

bunun yerine basıklığı arttırmak yerine değişen varyans gösteriyor gibi görünüyor. Karşılaştırma için, farklı standart sapmalarla çizdiğim üç normal yoğunluk (R kullanarak):

resim açıklamasını buraya girin

Gördüğünüz gibi, önceki resimle neredeyse aynı görünüyor. Bunların hepsi aynı basıklığa sahiptir. Aksine, şema için amaçlanan şeye muhtemelen daha yakın olan bir örnek

resim açıklamasını buraya girin

6

Bu genellikle insanların yoğunluğun şeklini gösteren basıklık hakkında konuştuklarında kastettiği şeydir. Bununla birlikte, basıklık ince olabilir - böyle çalışması gerekmez.

Örneğin, belirli bir varyansta, daha düşük bir zirve ile daha yüksek basıklık oluşabilir.

Ayrıca sıfır aşırı basıklık normallik anlamına gelen günaha (ve birkaç kitapta açıkça belirtilmiştir) dikkat edilmelidir. Aşırı basıklık 0 ile normal gibi olmayan dağılımlar vardır. İşte bir örnek:

dgam 2.3

Gerçekten de bu bir önceki noktayı göstermektedir. Normalden daha yüksek basıklık ile benzer görünümlü bir dağılım oluşturabilirim, ancak merkezde hala sıfırdır - tam bir zirve yokluğu.

Sitede basıklığı daha fazla tanımlayan bir dizi yazı vardır. Bir örnek burada .


Ama söylemedim mi? Kitap diyor mu?
Stat Tistician

Bunu biliyorum. Bunu asla söylediğini söylemedim. Hakkında sorduğunuz açık şekilde yanlış ifadelere yanıt vermemi nasıl önerirsiniz? Sadece yanlýţ olmadýklarýný mý düţünüyorsun?
Glen_b

1
@Glen_b Resimler kitaptan değil. Kitap resimler vermiyor. Bu resimler için goolge resim aramasını kullandım.
Stat Tistician

2
Bazı yazarlar basıklığı doruk noktası, bazıları da kuyruk ağırlığı olarak yazar, ancak basıklığın ölçtüğü her şeye kuşkuyla yaklaşan şüpheci yorum tamamen güvenli tek hikayedir. Tek başına Irving Kaplansky (1945) tarafından verilen sayısal örnekler, basıklığın her iki yorumu da kesin olarak göstermediğini göstermek için yeterlidir. (Kaplansky'nin makalesi, 1940'ların ortalarında olasılık ve istatistik hakkında yazdığı birkaç makaleden biridir. Seçkin bir cebirci
Nick Cox

1
Basıklığın doruk olduğunu iddia eden kitaplar ve makaleler var, bu yüzden ilk fıkra doğru kalıyor ve literatürde neler olduğu hakkında bir açıklama olarak desteklenebilir. Daha da önemlisi, Kaplansky'nin örneklerini ve argümanlarını nasıl gördüğü.
Nick Cox

3

μ±σ

Edit 11/23/2018: Bu yazıyı yazdığımdan beri basıklık üzerine bazı geometrik bakış açıları geliştirdim. Birincisi, fazla basıklık, normal kantil-kuantil arsa kuyruklarında beklenen 45 derece çizgiden sapmalar açısından geometrik olarak görselleştirilebilir; bkz. Bu QQ grafiği leptokurtik veya platykurtik dağılımı gösteriyor mu?

pV(v)V={(Xμ)/σ}4XE(V)VX

μ±σXμ±σμσX0.25μ±σμσ


3
İnsanları yazılarınızın çoğunda bir makaleye göndermeye devam etmek yerine, buradaki argümanları özetlemek ister misiniz? Yardıma bakın burada yazan yere özellikle "her zaman önemli bir rol alıntı", "her zaman bağlantılar için bağlam sağlamak" altında. Bu argümanın geniş olduğu yerde tam anlamıyla alıntı yapmak şart değildir, ancak en azından argümanın bir özeti gereklidir. Sadece birkaç kapsamlı ifade yaparsınız ve sonra bir makaleye bağlarsınız. Basıklık ifadesi önlemleri kuyruk davranışı (açıkça böylece) yanıltıcı (devamsızlık bağlam) 'dir
Glen_b -Reinstate Monica

2
... ama burada sunmadığınız argümanlara katılmamak ve belki de daha nüanslı bir sonuca varmak imkansız.
Glen_b-Monica

Argümanlarım açıkça burada ortaya konuyor : en.wikipedia.org/wiki/… Yorumlar hoş geldiniz! BTW, basıklık IS düşünülmüştür diğerleri gibi sadece aynı değil kuyruk ağırlık ölçüsüdür. | Z | <1 değerleri ona çok az katkıda bulunduğu için kuyruk ağırlığını ölçen E (Z ^ 4) ile kuyruk ağırlığını ölçer. Aynı mantıkla, E (Z ^ n), daha yüksek çift güçler için de kuyruk ağırlığı ölçütleridir.
Peter Westfall

Merhaba Peter, Eski yayınlarınızı değiştirebilmeniz için lütfen hesaplarınızı birleştirmek üzere stats.stackexchange.com/help/merging-accounts adresini ziyaret edin .
whuber

3

Farklı bir cevap: http://www.quantdec.com/envstats/notes/class_06/properties.htm : grafiksel anlardan gelen fikirleri kullanarak basıklığı geometrik olarak gösterebiliriz .

k=E(Xμσ)4=(xμσ)4f(x)dx
fXμ,σ2x ke=k3

Aşağıda, hepsi sıfır merkezli ve varyans 1 olacak şekilde ölçeklendirilmiş bazı simetrik dağılımlar için grafiksel basıklık grafiğini göstereceğim.

bazı simetrik dağılımlar için görsel basıklık

Kurtozun merkezden katkının sanal olarak yokluğuna dikkat edin, kurtozun "dorukluk" ile ilgisi yoktur.


1
Z2b+bb
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.