T-dağılımları yoğunluk fonksiyonunun arkasındaki sezgi


12

Student t-dağılımı hakkında çalışıyorum ve t-dağılımları yoğunluk işlevini nasıl türeteceğini merak etmeye başladım (wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution'dan ):

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

burada , serbestlik derecesidir ve , gama işlevidir. Bu işlevin sezgisi nedir? Yani, binom dağılımının olasılık kütle işlevine bakarsam, bu bana mantıklı geliyor. Ama t-dağılımları yoğunluk fonksiyonu benim için hiçbir anlam ifade etmiyor ... ilk bakışta hiç sezgisel değil. Yoksa sezgi sadece çan şeklinde bir eğriye sahip olması ve ihtiyaçlarımızı karşılaması mı?vΓ

Herhangi bir yardım için teşekkürler :)


3
Bu dağılım basit (ve güzel) geometrik bir yoruma sahiptir. Aslında, Öğrenci (1908) PDF'nin bu formunu ilk kez akıllı bir tahminden (Monte-Carlo simülasyonu tarafından desteklenen) elde etmesine rağmen, Fisher (c. 1920) ilk önce geometrik bir argümanla elde etti. Öz, , küresi ve yarıçapı (eksenden uzaklık ) üzerindeki bir (eşit dağılımlı nokta) yüksekliğinin oranının dağılımını açıklar : diğer bir deyişle, enleminin tanjantını. Bunun bir hesabı evolvedmicrobe.com/Literature/GeometricTDistribution.pdf adresinde sağlanır . fν+1
whuber

Yanıtlar:


9

Eğer bir standart normal rasgele değişken varsa ve bağımsız ki-kare rasgele değişken ile sonra df,ZQν

T=Z/Q/ν

Bir sahip ile dağıtım df. ( ne şekilde dağıtıldığından emin değilim , ama değil .)tνZ/Qt

Gerçek derivasyon oldukça standart bir sonuçtur. Alecos burada birkaç yol izliyor .

Sezgiye gelince, belirli fonksiyonel form için özel bir sezgim yok, ancak ( tarafından ölçeklendirilmiş ) bağımsız chi dağılımının doğru olduğu düşünülerek, şeklin genel bir genel duygusu elde edilebilir. skew:ν

resim açıklamasını buraya girin

Modu biraz 1 'in altında olan (ancak df arttıkça daha yakın 1'e alır) büyük ölçüde değişim yukarıda ve 1. aşağıdaki değerlerden bir ihtimali, varyansı olduğu anlamına gelir daha büyük olacaktır o . Değerleri esas itibarı ile 1 üzerinde yol açacak bir -değeri daha yakın 0 olduğunu esas olarak 1 'in altında olanlar neden olurken, bir -değeri daha 0 ile daha olduğunu ise.Q/νtZQ/νtZtZ

Bütün bunlar, değerlerinin (i) daha değişken, (ii) nispeten daha sivri ve (iii) normalden daha ağır kuyruklu olacağı anlamına gelir . Df arttıkça, 1 civarında yoğunlaşır ve sonra normale daha yakın olur.tQ/νt

resim açıklamasını buraya girin

('nispeten daha sivri' yayılmaya göre biraz daha keskin bir tepe noktası verir, ancak daha büyük varyans merkezi aşağı çeker, bu da pikin düşük df ile biraz daha düşük olduğu anlamına gelir)

Bu yüzden neden göründüğü hakkında bir sezgi .t


1
Açıklamamda biraz özensiz davrandım. Tabii ki Ki-kare dağıtılmış rasgele değişkenin serbestlik derecesine göre karekökü idi.
Analist

@Analyst Aynı şeyi kendim bir kereden fazla yaptım.
Glen_b

9

Glen'in cevabı doğrudur, ancak Bayesci bir bakış açısından, t-dağılımını farklı varyanslarla normal dağılımların sürekli bir karışımı olarak düşünmek de yararlıdır. Türevi burada bulabilirsiniz:

Gaussian karışımı olarak öğrenci t

Bu yaklaşımın sezginize yardımcı olduğunu düşünüyorum çünkü popülasyonunuzun kesin değişkenliğini bilmediğinizde t dağılımının nasıl ortaya çıktığını açıklıyor.


2
Burada normal dağılımların bir karışımı olarak t dağılımının bir animasyonunu yaptım: sumsar.net/blog/2013/12/t-as-a-mixture-of-normals
Rasmus Bååth 6:13
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.