normal dağılıma göre daha ağır kuyruğa sahip t-dağılımı


10

Ders notlarımda şöyle diyor,

t-dağılımı normal gibi gözükse de, biraz daha ağır kuyruklarla.

Neden normal görüneceğini anlıyorum (Merkezi Limit Teoremi nedeniyle). Ancak, normal dağılımdan daha ağır kuyruklara sahip olduğunu matematiksel olarak nasıl kanıtlayacağımı ve normal dağılımdan ne kadar ağır olduğunu ölçmenin bir yolu olup olmadığını anlamakta zorlanıyorum.

Yanıtlar:


12

Yapılacak ilk şey, "ağır kuyruk" ile kastettiğimizi resmileştirmektir. Her iki dağıtımın da aynı konuma ve ölçeğe (örneğin standart sapma) sahip olmasını standartlaştırdıktan sonra yoğunluğun aşırı kuyrukta ne kadar yüksek olduğuna bakılamaz:

resim açıklamasını buraya girin
( sorunuzla biraz alakalı olan bu cevaptan )

[Bu durumda, ölçeklendirme sonunda gerçekten önemli değil; t çok farklı ölçekler kullansanız bile normalden daha ağır olacaktır; normal sonuçta her zaman daha düşük olur]

Bununla birlikte, bu tanım - bu özel karşılaştırma için uygun olsa da - çok iyi bir genelleme yapmaz.

Daha genel olarak, burada daha iyi bir tanım whuber'ın cevabındadır . Dolayısıyla , daha ağır kuyruklu ise , yeterince tüm bazı ), , burada , burada daha ağır için) - sağda kuyruklu; diğer tarafta benzer, açık bir tanım var).YXtt>t0SY(t)>SX(t)S=1-FF

resim açıklamasını buraya girin

Burada log ölçeğinde ve normalin kantil ölçeğinde, daha fazla ayrıntı görmemizi sağlıyor:

resim açıklamasını buraya girin

Bu durumda, daha ağır kuyrukluğun "kanıtı" cdf'lerin karşılaştırılmasını ve t-cdf'nin üst kuyruğunun her zaman normalin üstünde olduğunu ve t-cdf'nin alt kuyruğunun sonunda normalin altında olduğunu göstermeyi içerir.

Bu durumda yapılacak en kolay şey yoğunlukları karşılaştırmak ve daha sonra cdfs'nin (/ survivor fonksiyonları) karşılık gelen göreceli konumunun bundan sonra gelmesi gerektiğini göstermektir.

Yani, örneğin (bazı verilmiş en iddia eğer )ν

x2-(ν+1)günlük(1+x2ν)>2günlük(k)

Gerekli sabiti için (bir fonksiyonu ), herkes için bazı , o zaman için daha ağır bir kuyruk oluşturmak mümkün olacağını da daha büyük yönünden tanımına (veya daha büyük üzerinde sol kuyruk).kνx>x0tν1-FF

(bu form, yoğunlukların tutarları arasında gerekli ilişkiyi barındırıyorsa, yoğunlukların günlüğünün farkından kaynaklanır)

[Aslında bunu herhangi bir için göstermek mümkündür (sadece ilgili yoğunluk normalleştirici sabitlerden gelmemiz gereken özel değil), bu nedenle sonuç ihtiyacımız olan için geçerli olmalıdır .]kk


1
(ve belki de biraz uzatan bir grafik daha ağır kuyrukları daha net gösterebilir ve daha yüksek serbestlik dereceleriyle de çalışabilir,günlükS(x)x
Henry

1
@Henry Böyle bir arsa oluşturdum ama ne kadar katma değer olduğundan emin olamadım. Onu yerleştirmeyi düşüneceğim.
Glen_b

1
@Henry Arsa dahil.
Glen_b

2

Farkı görmenin bir yolu anlarının kullanılmasıdırE{xn}.

"Daha ağır" kuyruklar, varyans aynı olduğunda eşit güç momentleri (güç 4, 6, 8) için daha yüksek değerler anlamına gelir. Özellikle, 4. dereceden moment (sıfır civarında) basıklık olarak adlandırılır ve bir anlamda kuyrukların ağırlığını karşılaştırır.

Ayrıntılar için Wikipedia'ya bakın ( https://en.wikipedia.org/wiki/Kurtosis )


1
Gerçi bir tile dağıtım 3 veya 4 serbestlik derecesi, basıklık sonsuz iken 2 serbestlik derecesi standart sapma sonsuzdur, bu nedenle basıklığı hesaplayamazsınız ve 1 ortalama veya ortalama 4inci an.
Henry

3
@Henry Yine de bu fikir iyidir. Öğrencinin CDF'sini Genişletmekt(ν) etrafında dağıtım + asimptotik olarak orantılı olduğunu gösterir x-ν. Böylece tüm mutlak ağırlık momentleriν var ve tüm mutlak ağırlık anları νıraksar. Normal dağılımda, tüm mutlak momentler vardır. Bu, tüm Öğrencilerin kuyruklarının kesin bir sırasını sağlartdağılımları ve Normal dağılım. Aslında, parametreνbir kuyruğun ağırlığının nasıl ölçüleceği hakkındaki orijinal soruya bir cevap verir.
whuber

2

İşte hayatta kalma işlevlerine dayanan resmi bir kanıt. Ben wikipedia esinlenerek aşağıdaki "ağır kuyruk" tanımını kullanın :

Rastgele bir değişken Y hayatta kalma fonksiyonu ile Sy(t) rastgele bir değişkenden daha ağır kuyrukları var X hayatta kalma fonksiyonu ile Sx(t) iFF

limtSy(t)Sx(t)=

Ortalama sıfır, serbestlik derecesi ve ölçek parametresi ile Student t olarak dağıtılan rastgele bir değişkenini düşünün . Bunu rastgele değişken . Her iki değişken için de sağkalım fonksiyonları farklılaşabilir. Bu nedenle, YνbirX~N-(0,σ2)

limtSy(t)Sx(t)=limtfy(t)fx(t)=tecrübelimt(günlükfy(t)-günlükfx(t))=tecrübelimt(-ν+12günlük(1+t2νbir2)-(-12σ2t2)+C)=tecrübe(limt-ν+12günlük(1+t2νbir2)-(-12σ2t2)+C)=tecrübe(limt12σ2t2-ν+12günlük(1+t2νbir2)+C)=tecrübe(12limubir2σ2u-(ν+1)günlük(1+uν)+C)=tecrübe(12limuu(bir2σ2-(ν+1)günlük(1+uν)u+Cu))
Burada . Not bu bir sabit ve Bu nedenle cebirsel limit teoremi ile u=t2/bir20<bir2/σ2<limuC/u=0
limu(ν+1)günlük(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=tecrübe(12limuu(bir2σ2-(0)+(0)))=

Önemli olarak, sonuç , ve rastgele (sonlu) değerleri için geçerlidir , böylece dağıtımda normalden daha küçük varyansa sahip, ancak yine de daha ağır kuyruklara sahip olan durumlar olabilir.birσ2ν


1
Daha ağır kuyrukların bu "tanımının" her zaman kabul edilemez olduğuna dikkat edin. Örneğin, bu tanım gereği, N (0,1) dağılımı, son dağılım üretmesine rağmen .9999 * U (-1,1) + .0001 * U (-1000, 1000) dağılımından daha ağır kuyruklara sahiptir. sınırlı desteğe rağmen, ortalamadan ortalama 175 standart sapma değeri. Elbette, N (0,1) de bu tür değerleri üretir, ancak olasılıklar pratik amaçlar için uygun sayılabilecek değerlerin çok altındadır.
Peter Westfall
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.