Bu, serbestlik dereceleri ve istatistiksel parametreler ve bu ikisinin doğrudan basit bir bağlantıya sahip olmasının neden güzel olduğu hakkında bir hikaye.
Tarihsel olarak, " - 1−1 " terimleri Euler'in Beta işlevi ile ilgili çalışmalarında ortaya çıktı. Bu parametreleştirmeyi 1763 yılına kadar kullanıyordu ve Adrien-Marie Legendre de kullanıyordu: kullanımları daha sonraki matematiksel sözleşmeyi oluşturdu. Bu çalışma bilinen tüm istatistiksel uygulamaları ön plana çıkarmaktadır.
Modern matematiksel teori, analiz, sayı teorisi ve geometri uygulamalarının zenginliği yoluyla, " - 1−1 " terimlerinin aslında bir anlamı olduğuna dair geniş göstergeler sağlar . Soruya yapılan yorumlarda bu nedenlerden bazılarını çizdim.
Daha ilgi çekici olan, "doğru" istatistiksel parametrelendirmenin ne olması gerektiğidir. Bu o kadar net değil ve matematiksel kurallarla aynı olmak zorunda değil. Yaygın olarak kullanılan, iyi bilinen, birbiriyle ilişkili olasılık dağılım ailelerinden oluşan büyük bir ağ vardır. Dolayısıyla, bir aileyi adlandırmak (yani parametreleştirmek) için kullanılan sözleşmeler tipik olarak ilgili aileleri adlandırmak için ilgili sözleşmeleri ima eder. Bir parametreleştirmeyi değiştirin ve hepsini değiştirmek istersiniz. Dolayısıyla bu ilişkilere ipucu verebiliriz.
Çok az insan, en önemli dağıtım ailelerinin Normal aileden geldiği konusunda hemfikir değildir. Hatırlayın rastgele değişken olduğu XX olduğu söylenir "normal dağılım" zaman ( x - μ ) / σ(X−μ)/σ bir olasılık yoğunluk sahip f ( x )f(x) ile orantılı exp ( - x 2 / 2 )exp(−x2/2) . Tüm σ = 1σ=1 ve μ = 0μ=0 , X,X bir olduğu söylenir standart normal dağılım.
Birçok veri kümesi x 1 , x 2 , … , x nx1,x2,…,xn , verilerin rasyonel kombinasyonlarını ve düşük güçleri (tipik olarak kareler) içeren nispeten basit istatistikler kullanılarak incelenir. Bu veriler bir Normal dağılımından rastgele örnekler olarak modellendiğinde - her x ixi bir Normal değişken X i'nin gerçekleşmesi olarak görülüyorsa Xi, tüm X iXi ortak bir dağılımı paylaşır ve bağımsızdır - bu istatistiklerin dağılımları bu Normal dağılım ile belirlenir. Uygulamada en sık ortaya çıkan
t νtν , ν = n - 1 "serbestlik derecesi"ileÖğrenci tt dağılımı. Bu t = ˉ X istatistiğinin dağılımıdırν=n−1se ( X )
t=X¯se(X)
burada ˉ X =(X1+X2+⋯+Xn)/nX¯=(X1+X2+⋯+Xn)/nverinin ortalamasını modeller vese(X)=(1/√n ) √( X 2 1 + X 2 2 + ⋯ + X 2 n ) / ( n - 1 ) - ˉ X 2se(X)=(1/n−−√)(X21+X22+⋯+X2n)/(n−1)−X¯2−−−−−−−−−−−−−−−−−−−−−−−−−−−−√ , ortalamanın standart hatasıdır. İle bölmen-1n−1ŞekilNnolmalıdır22ya da daha büyük, neredenννbir tam sayı olduğu11veya daha büyüktür. Formül, görünüşe göre biraz karmaşık olsa da, ikinci derece verilerin rasyonel bir fonksiyonunun kare köküdür: nispeten basittir.
χ 2 ν , χ 2 (ki-kare) dağılımıile cyclotron frekansının "serbestlik derecesine" (df). Bu, ν bağımsız standart Normal değişkenlerinkarelerinin toplamının dağılımıdır. Bu değişkenlerin karelerinin ortalamasının dağılımı bu nedenle 1 / ν ile ölçeklendirilmişbir χ 2 dağılımıolacaktır: Buna "normalleştirilmiş" χ 2 dağılımıolarak değineceğim.χ2νχ2ννχ21/νχ2
K v 1 , ν 2 , F parametrelerle oranı dağılımı ( ν 1 , ν 2 ) iki bağımsız normalize oranıdır χ 2 ile dağılımları cyclotron frekansının 1 ve ν 2 serbestlik derecesi.Fν1,ν2F(ν1,ν2)χ2ν1ν2
Matematiksel hesaplamalar, bu üç dağılımın da yoğunluklarının olduğunu göstermektedir. Önemlisi, χ 2 ν dağılımının yoğunluğu, Euler'in Gamma ( Γ ) fonksiyonunun integral tanımındaki integrandle orantılıdır . Onları karşılaştıralım:χ2νΓ
f χ 2 ν ( 2 x ) ∝ x ν / 2 - 1 e - x ;f Γ ( ν ) ( x ) ∝ x ν - 1 e - x .
fχ2ν(2x)∝xν/2−1e−x;fΓ(ν)(x)∝xν−1e−x.
Bu, iki χ 2 ν değişkeninin ν / 2 parametresi ile bir Gama dağılımına sahip olduğunu gösterir . Yarının faktörü yeterince rahatsız edicidir, ancak 1'in çıkarılması ilişkiyi daha da kötüleştirir. Bu zaten soruya zorlayıcı bir cevap besler: Biz bir parametre istiyorsanız χ 2 dağılımı (kat kadar bunu üretmek kare Normal değişkenlerin sayısını saymak için 1 / 2 , onun yoğunluk fonksiyonu şırası sonra üs) bu sayının yarısından az olmak. χ2νν/21χ21/2
Neden bir faktördür 1 / 2 lik bir fark daha az zahmetli 1 ? Bunun nedeni, bir şeyler eklediğimizde faktörün tutarlı kalmasıdır. Karelerinin toplamı ise n bağımsız standart Normallerin parametresi olan bir Gama dağılımı ile orantılı olduğu , n (kez bir faktör), kareler durumunda RI m bağımsız standart Normallerin parametresi ile bir Gamma dağılımı ile orantılı olduğu m (kez aynı faktör) tüm n + m değişkenlerinin karelerinin toplamı, m + n parametresine sahip bir Gama dağılımı ile orantılıdır (yine de aynı faktörün çarpı). 1/21nnmmn+mm+nParametreleri eklemenin, sayımları eklemeyi öylesine yakından taklit etmesi çok yararlıdır.
Bununla birlikte, o sinir bozucu görünümlü " - 1 " i matematiksel formüllerden çıkarsaydık, bu hoş ilişkiler daha karmaşık hale gelirdi. Biz değişti Örneğin, Gama dağılımları parametrizasyonu gerçek güç atıfta x bir böylece formül χ 2 1 dağılımı "Gama ile ilgili olacaktır ( 0 ) güç yana (" dağıtım x de onun PDF 1 - 1 = 0 ), o zaman üç χ 2 1 dağılımının toplamına "Gama ( 2 )−1xχ21(0)x1−1=0χ21(2)"dağıtım. Kısacası, serbestlik dereceleri ile Gamma dağılımlarındaki parametre arasındaki yakın katkı ilişkisi, - 1'in formülden çıkarılması ve parametreye alınmasıyla kaybedilecektir .−1
Benzer şekilde, bir F oranı dağılımının olasılık fonksiyonu Beta dağılımları ile yakından ilişkilidir. Gerçekten de, ne zaman , Y bir sahiptir F oranı dağılımı dağılımı Z = ν 1 , Y / ( ν 1 , Y + ν 2 ) bir Beta sahiptir ( ν 1 / 2 , ν 2 / 2 ) dağılımı. Yoğunluk fonksiyonu ile orantılıdırFYFZ=ν1Y/(ν1Y+ν2)(ν1/2,ν2/2)
fZ(z)∝zν1/2−1(1−z)ν2/2−1.
fZ(z)∝zν1/2−1(1−z)ν2/2−1.
Furthermore--taking these ideas full circle--the square of a Student tt distribution with νν d.f. has an FF ratio distribution with parameters (1,ν)(1,ν). Once more it is apparent that keeping the conventional parameterization maintains a clear relationship with the underlying counts that contribute to the degrees of freedom.
From a statistical point of view, then, it would be most natural and simplest to use a variation of the conventional mathematical parameterizations of ΓΓ and Beta distributions: we should prefer calling a Γ(α)Γ(α) distribution a "Γ(2α)Γ(2α) distribution" and the Beta(α,β)(α,β) distribution ought to be called a "Beta(2α,2β)(2α,2β) distribution." In fact, we have already done that: this is precisely why we continue to use the names "Chi-squared" and "FF Ratio" distribution instead of "Gamma" and "Beta". Regardless, in no case would we want to remove the "−1−1" terms that appear in the mathematical formulas for their densities. If we did that, we would lose the direct connection between the parameters in the densities and the data counts with which they are associated: we would always be off by one.