Serbestlik dereceleri nasıl anlaşılır?


257

Gönderen Vikipedi , bir istatistik serbestlik derecesi üç yorumlar vardır:

İstatistiklerde, serbestlik derecelerinin sayısı, değişmeden serbest olan bir istatistiğin son hesaplamasındaki değerlerin sayısıdır .

İstatistiksel parametrelerin tahminleri, farklı miktarlarda bilgi veya verilere dayanabilir. Bir parametrenin tahminine giren bağımsız bilgi sayısına serbestlik derecesi (df) denir. Genel olarak, bir parametrenin bir tahmini serbestlik derecesi eşittir tahmin gitmek bağımsız puan sayısı eksi parametresi kendisinin tahmininde ara adımlar olarak kullanılan parametre sayısı (örneği varyans, olan, birincisi, örneklem ortalaması tek ara adım olduğu için).

Matematiksel olarak, serbestlik dereceleri, rastgele bir vektörün alanının boyutudur veya temel olarak 'özgür' bileşenlerin sayısıdır: vektör tam olarak belirlenmeden önce ne kadar bileşenin bilinmesi gerekir .

Kalın sözler tam olarak anlamadığım şey. Mümkünse, bazı matematiksel formülasyonlar kavramı netleştirmeye yardımcı olacaktır.

Ayrıca üç yorum birbiriyle aynı fikirde mi?



3
Ayrıca şu soruya bakın: "Serbestlik derecesi nedir?"
Jeromy Anglim

Yanıtlar:


242

Bu ince bir soru. Bu düşünceli kişi alır değil bu alıntılar anlamak! Her ne kadar anlamlı olsalar da, hiçbirinin tam veya genel olarak doğru olmadığı ortaya çıktı. Tam bir açıklama yapmak için zamanım yok (ve burada boş yer yok), ancak bir yaklaşımı ve önerdiği bir anlayışı paylaşmak istiyorum.

Serbestlik derecesi (DF) kavramı nerede ortaya çıkar? Temel tedavilerde bulunduğu bağlamlar:

  • Student t-testi ve (iki popülasyonu, farklı varyansa var) Behrens-Fisher sorununa Welch veya Satterthwaite çözeltiler gibi varyantları.

  • Ki-kare dağılımı ( varyansın örnekleme dağılımında belirtilen bağımsız standart Normların karelerinin toplamı olarak tanımlanmıştır) .

  • F-testi (tahmini varyans oranları).

  • Chi-square testi , acil durum tablolarda bağımsızlık ve dağılım tahminlerinin fit iyiliği için, (b) test için, (a) test kullanımları içermektedir.

Ruhsal olarak, bu testler kesin olmaktan (Öğrenci t-testi ve Normal değişkenler için F-testi) doğru yaklaşımlardan (Öğrenci t-testi ve çok kötü olmayan veriler için Welch / Satterthwaite testleri) ) asimptotik yaklaşımlara dayanmak (Ki-kare testi). Bunlardan bazılarının ilginç bir yanı, integral olmayan "serbestlik dereceleri" nin ortaya çıkmasıdır (Welch / Satterthwaite testleri ve göreceğimiz gibi, Ki-kare testi). Bu özel bir ilgi alanıdır çünkü DF'nin iddia ettiği hiçbir şey olmadığı ilk ipucu .

Sorudaki bazı iddiaları derhal elden çıkarabiliriz. "Bir istatistiğin nihai hesaplanması" iyi tanımlanmadığından (görünüşe göre hesaplama için hangi algoritmanın kullanıldığına bağlıdır), belirsiz bir öneriden başka bir şey olamaz ve başka bir eleştiriye değer değildir. Benzer şekilde, "tahminde kullanılan bağımsız puan sayısı" ya da "ara adım olarak kullanılan parametre sayısı" da iyi tanımlanmamıştır.

"Bir" tahminde bulunacak bağımsız bilgi parçalarıyla " uğraşmak zordur, çünkü burada ilgili olabilecek iki farklı, ancak birbiriyle ilişkili" bağımsız "algıları vardır. Biri rasgele değişkenlerin bağımsızlığı; diğeri işlevsel bağımsızlıktır. Basitlik için, diyelim ki, üç yan uzunluklarının - ikinci bir örnek olarak, deneklerin morfometrik ölçümlerinin toplanması varsayalım , , , yüzey alanları ve hacim bölgesinin tahta bloklar kümesi. Üç yan uzunluk bağımsız rastgele değişkenler olarak kabul edilebilir, ancak beş değişkenin tümü bağımlı RV'lerdir. Beşi de işlevsel olarakY, Z, S = 2 ( X -Y + Y , Z + Z X ) V = X , Y , Z ( X , Y , Z, , S , V ) R, 5 ω R, 5 f ω g ω f ω ( x ( ψ ) , , V ( ψ ) ) = 0 g ωXYZS=2(XY+YZ+ZX)V=XYZçünkü bağımlı değer kümesi ( değil vektör değerli rastgele değişkenin "alan"!) in bir üç-boyutlu bir manifold üzerinden izleri . (Bu nedenle, yerel olarak herhangi bir noktasında , ve olmak üzere iki işlevi vardır; bunlar için ve puan "yakın" ve türevleri ve değerlendirildi(X,Y,Z,S,V)R5ωR5fωgωfω(X(ψ),,V(ψ))=0ψ ω f g ω ( X , S , V )gω(X(ψ),,V(ψ))=0ψωfgωdoğrusal bağımsızdır) Ancak -. Burada vurucu - blok birçok olasılık önlemleri için, bu gibi değişkenlerin alt-gruplar olan bağımlı rastgele değişken olarak, ancak işlevsel olarak bağımsız olarak gerçekleştirilir.(X,S,V)

Bu potansiyel belirsizlikler tarafından uyarıldığımızda, muayene için Ki-kare uygunluk testini kaldıralım , çünkü (a) basit, (b) insanların DF'yi almak için gerçekten bilmeleri gereken genel durumlardan biri. p-değeri doğru ve (c) genellikle yanlış kullanılır. İşte bu testin en az tartışmalı uygulamasının kısa bir özeti:

  • Bir popülasyon örneği olarak kabul edilen bir veri değerleri koleksiyonunuz .(x1,,xn)

  • Bir dağıtımın bazı parametrelerini tahmin . Örneğin, Normal dağılımın ortalama ve standart sapma , popülasyonun normal şekilde dağıldığını, ancak (veri elde önce) ne veya olacağını .θ 1 θ 2 = θ p θ 1 θ 2θ1,,θpθ1θ2=θpθ1θ2

  • Peşin olarak, bir dizi yarattı verileri için "kutuları". (Bu, genellikle yapılmasına rağmen, kutular verilerle belirlendiğinde sorunlu olabilir.) Bu kutuları kullanarak, veriler her kutudaki sayım kümesine düşürülür. nın gerçek değerlerinin ne olacağını tahmin ederek , her bir kutucuğun yaklaşık olarak aynı sayı alacağı şekilde (umarım) ayarladınız. (Eşit olasılıklı binicilik, ki kare dağılımının gerçekten tarif edilmek üzere ki kare istatistiğinin gerçek dağılımına iyi bir yaklaşım olduğunu garanti eder.)( θ )k(θ)

  • Çok fazla veriye sahipsiniz - neredeyse tüm çöplerin sayısının 5 veya daha büyük olması gerektiğini garanti etmek için yeterli. (Bu, umuyoruz , istatistiğinin örnekleme dağılımının, bazı dağılımı tarafından uygun şekilde yaklaştırılmasını sağlayacaktır .)χ 2χ2χ2

Parametre tahminlerini kullanarak, her bölmedeki beklenen sayımı hesaplayabilirsiniz. Ki-kare istatistiği, oranların toplamıdır.

(observedexpected)2expected.

Bu, birçok otorite bize (çok yakın bir yaklaşıma kadar) Ki-kare dağılımına sahip olması gerektiğini söylüyor. Fakat bu tür dağıtımların bir ailesi var. Bir parametre ile ayrılan sık olarak anılacaktır "serbestlik derecesi". nasıl belirleyeceğinize dair standart akıl yürütme böyle giderννν

Benim sayım var. Bu veri parçaları. Ancak aralarında ( işlevsel ) ilişkiler vardır. Başlamak için, sayımların toplamının eşit olması gerektiğini önceden biliyorum . Bu bir ilişki. Verilerden iki (veya , genellikle) parametre tahmin ettim . Bu iki (veya ) ek ilişki, toplam ilişki veriyor . Varsayalım ki (parametreler) hepsi ( işlevsel olarak ) bağımsızdır, sadece ( işlevsel olarak ) bağımsız "serbestlik dereceleri" bırakır : için kullanılacak değer budur .k n p p p + 1 k - p - 1 νkknppp+1kp1ν

Bu akıl yürütmeyle ilgili sorun (bu, söz konusu alıntıların işaret ettiği hesaplama şeklidir) bazı özel ek koşulların geçerli olduğu durumlar haricinde yanlış olmasıdır. Üstelik bu şartlar var hiçbir şey parametrelerinin numaraları ile veri "bileşenleri" nin sayılarla bağımsızlık (fonksiyonel veya istatistik) ile ilgisi, ne de herhangi bir şeyle başka asıl soruya atıfta.

Size bir örnek göstereyim. (Bunu olabildiğince açık yapmak için, az sayıda kutu kullanıyorum, ancak bu zorunlu değil.) 20 bağımsız ve aynı şekilde dağıtılmış (iid) standart Normal değişkenler üretelim ve normal formüllerle ortalama ve standart sapmalarını tahmin edelim ( ortalama = toplam / sayım, vb .) Uyum iyiliğini test etmek için standart bir normalin çeyreklerinde kesme noktaları olan dört kutu oluşturun: -0.675, 0, +0.657 ve Ki-kare istatistiğini üretmek için kutu sayımlarını kullanın. Sabrın izin verdiği ölçüde tekrarlayın; 10.000 tekrar yapmak için zamanım vardı.

DF hakkındaki standart bilgelik, 4 kutu ve 1 + 2 = 3 sınırlamamız olduğunu söylüyor; bu 10.000 Ki-kare istatistiğinin dağılımını gösteren 1-kare ile ki-kare dağılımını takip etmeli. İşte histogram:

Şekil 1

Koyu mavi çizgi, dağılımının PDF'sini - çalışacağımızı düşündüğüm - grafiğini çizerken, koyu kırmızı çizgi dağılımının grafiğini çizer (bu iyi bir şey olur) Biri size söyleseydi, tahmin edin yanlış. Verilere de uymuyor.χ 2 ( 2 ) ν = 1χ2(1)χ2(2)ν=1

Sorunun, veri kümelerinin küçük boyutundan ( = 20) veya belki de kutu sayısının küçük boyutundan kaynaklanacağını bekleyebilirsiniz . Bununla birlikte, sorun çok büyük veri kümelerinde ve daha fazla sayıda kutuda bile devam eder: yalnızca bir asimptotik yaklaşıma ulaşmada bir başarısızlık değildir.n

İşler ters gitti, çünkü Ki-kare testinin iki gereksinimini ihlal ettim:

  1. Parametrelerin Maksimum Olabilirlik tahminini kullanmalısınız . (Bu gereklilik, pratikte hafifçe ihlal edilebilir.)

  2. Bu tahminin gerçek verilere değil , sayılara dayandırılması gerekir ! (Bu çok önemlidir .)

şekil 2

Kırmızı histogram, bu gereklilikleri takip eden 10.000 ayrı yineleme için ki-kare istatistiklerini gösterir. Yeterince emin olun, aslında ümit ettiğimiz gibi , eğrisini (kabul edilebilir miktarda örnekleme hatasıyla) görünür şekilde takip eder .χ2(1)

Geldiğinizi gördük umut - - Bu karşılaştırma noktası doğru DF p-değerlerinin hesaplanması için kullanmak olmasıdır birçok şeye bağlıdır diğer manifoldu boyutları, fonksiyonel ilişkilerin sayımları, veya Normal değişkenlerin aldıkları geometrisinden daha . Miktarlar arasındaki matematiksel ilişkilerde olduğu gibi , belirli fonksiyonel bağımlılıklar arasında ince ve hassas bir etkileşim vardır ve verilerin dağılımını , istatistiklerini ve bunlardan oluşan tahmin edicileri içerir. Buna göre, DF'nin çok değişkenli normal dağılımların geometrisi veya fonksiyonel bağımsızlık veya parametre sayıları veya bu nitelikteki herhangi bir şey açısından yeterince açıklanamaz.

O zaman, “serbestlik derecelerinin” yalnızca (t, Ki-kare ya da F) istatistiklerinin örnekleme dağılımının ne olması gerektiğini öneren bir sezgisel olduğunu görmemize neden olur, ancak münhasır değildir. Elverişli olduğu inancı korkunç hatalara yol açar. (Örneğin, "chi kare uyum iyiliği" ni ararken, Google’ın en çok isabet eden kısmı , bir lig lig üniversitesinin , bu sorunun tamamen yanlış olduğunu gösteren bir web sayfasıdır ! 7 DF'nin aslında 9 DF'ye sahip olduğunu tavsiye ettiği değer.)

Bu daha ayrıntılı bir anlayışla, söz konusu Wikipedia makalesini tekrar okumak faydalı olacaktır: ayrıntılarında, DF sezgiselinin çalışma eğiliminde olduğunu ve bunun yaklaşık bir değer olduğu ya da hiç uygulanmadığı yerlere işaret eder.


Burada gösterilen fenomenin iyi bir açıklaması (beklenmedik bir şekilde ki-kare GOF testlerinde yüksek DF) 5. baskıda Kendall ve Stuart'ın Cilt II'sinde görünmektedir . Beni bu tür faydalı analizlerle dolu olan bu harika metne geri götürme fırsatı bulduğum için müteşekkirim.


Düzenle (Oca 2017)

İşte R"DF hakkındaki standart bilgelik ..."

#
# Simulate data, one iteration per column of `x`.
#
n <- 20
n.sim <- 1e4
bins <- qnorm(seq(0, 1, 1/4))
x <- matrix(rnorm(n*n.sim), nrow=n)
#
# Compute statistics.
#
m <- colMeans(x)
s <- apply(sweep(x, 2, m), 2, sd)
counts <- apply(matrix(as.numeric(cut(x, bins)), nrow=n), 2, tabulate, nbins=4)
expectations <- mapply(function(m,s) n*diff(pnorm(bins, m, s)), m, s)
chisquared <- colSums((counts - expectations)^2 / expectations)
#
# Plot histograms of means, variances, and chi-squared stats.  The first
# two confirm all is working as expected.
#
mfrow <- par("mfrow")
par(mfrow=c(1,3))
red <- "#a04040"  # Intended to show correct distributions
blue <- "#404090" # To show the putative chi-squared distribution
hist(m, freq=FALSE)
curve(dnorm(x, sd=1/sqrt(n)), add=TRUE, col=red, lwd=2)
hist(s^2, freq=FALSE)
curve(dchisq(x*(n-1), df=n-1)*(n-1), add=TRUE, col=red, lwd=2)
hist(chisquared, freq=FALSE, breaks=seq(0, ceiling(max(chisquared)), 1/4), 
     xlim=c(0, 13), ylim=c(0, 0.55), 
     col="#c0c0ff", border="#404040")
curve(ifelse(x <= 0, Inf, dchisq(x, df=2)), add=TRUE, col=red, lwd=2)
curve(ifelse(x <= 0, Inf, dchisq(x, df=1)), add=TRUE, col=blue, lwd=2)
par(mfrow=mfrow)

40
Bu inanılmaz bir cevap. Bunun için internette kazandın.
Adam,

6
@caracal: Normal dağılım için, örneğin, bir MLE: bildiğiniz gibi orijinal veriler için ML yöntemleri rutin ve yaygın demek örnektir ve MLE örnek standart sapma kare köküdür ( olağan önyargı düzeltmesi olmadan ). Sayımlara dayalı tahminler elde etmek için, sayımların olabilirlik fonksiyonunu hesapladım - bu, CDF'nin kesme noktalarındaki hesaplama değerlerini, günlüklerini alarak, sayımlarla çarpma ve ekleme - ve genel optimizasyon yazılımı kullanarak optimize etmeyi gerektirir. σμσ
whuber

4
@caracal Muhtemelen artık ihtiyacın yok, ama artık bindirilmiş Rverinin ML'ye uyması için bir kod örneği şimdi ilgili bir soruda ortaya çıkıyor: stats.stackexchange.com/a/34894 .
whuber

1
“Bu akıl yürütmeyle ilgili sorun (bu, söz konusu alıntıların işaret ettiği hesaplama şeklidir) bazı özel ek koşulların geçerli olduğu durumlar dışında yanlış olmasıdır.” Şimdi (neredeyse) doğrusal modeller dizisinin iki döneminden geçiyorum ve karesel formun "ortasında" matrisin sırası olmak için serbestlik derecelerini anlıyorum. Bu "ek koşullar" nedir?
Klarnetçi

4
@Clarinetist Cevabımın asıl amacı, size öğretilenin, iki DF kavramının karışıklığına dayandığını öne sürmektir. Her ne kadar bu karışıklık standart en küçük kareler için sorun çıkarmasa da, Normal teori modelleri, beklenmedik durum tablolarının analizi gibi basit ve yaygın durumlarda bile hatalara yol açmaktadır. Bu matris sırası işlevsel DF'yi verir . Bir en küçük kareler doğrusal modelinde durumda , örneğin F testleri gibi testler belirli tür için doğru DF elde edildi. Ki-kare testi için, özel koşullar cevabın sonraki noktalarında (1) ve (2) olarak sıralanmıştır.
whuber

74

Ya da basitçe: Sayısal dizideki öğelerin sayısı, istatistiklerin değeri değişmeden kalacak şekilde değiştirmenize izin verilir.

# for instance if:
x + y + z = 10

Eğer örnek için, değiştirebilir x ve y rastgele ancak değiştiremez z (yapabilirsiniz, ancak rastgele, bu nedenle değilsin serbest - Eğer değerini değiştirmek gerekir, çünkü bunu değiştirmek için Harvey'in yorumunu bakınız) İstatistiğin olduğu (Σ = 10). Yani, bu durumda df = 2.


19
“Z'yi değiştiremezsiniz” demek pek doğru değil. Aslında, toplamı 10'a eşit yapmak için z'yi değiştirmek zorundasınız. Ancak, neyin değiştiği konusunda başka seçeneğiniz yok (özgürlük yok). İki değeri değiştirebilirsiniz, ancak üçünü değiştiremezsiniz.
Harvey Motulsky

53

Konsept, -boyutlu Öklid geometrisi, alt-uzaylar ve ortogonal çıkıntılar hakkında genel bilgi verildiğinde, matematiksel kesinliği sağlamak hiç de zor değildir .n

Eğer bir bir dik izdüşüm gelen R, n a s boyutlu alt uzay L ve X olan keyfi bir n -vector sonra p X de bir L , X - P X ve P x ortogonal ve vardır x - p x L içinde L' nin dikgen tamamlayıcısı . Bu ortogonal tamamlayıcı boyutu L olduğu , n - s . EğerPRnpLxnPxLxPxPxxPxLLLnp bir farklılık serbesttir , n sonra boyutlu uzayda x - P X bir farklılık serbesttir n - p boyutlu bir alan. Bu nedenle x - P x'in n - p serbestlik derecelerinesahipolduğunu söylüyoruz.xnxPxnpxPxnp

Çünkü eğer Bu hususlar istatistik için önemli olan bir bir n- boyutlu rasgele vektör ve L de, ortalama bir modeldir, yani, ortalama vektör e ( X ) olan L sonra çağrı X - p x vektörünü artıkları ve artıkları kullanarak varyansı tahmin ediyoruz. Artıkların vektörü n - p serbestlik derecelerine sahiptir, yani n - p boyutunun bir alt alanı ile sınırlıdır .XnLE(X)LXPXnpnp

Koordinatları halinde bağımsız ve normal olarak, aynı varyans ile dağıtılır σ 2 daha sonraXσ2

  • ve X - P X vektörleri bağımsızdır.PXXPX
  • Eğer artıkların vektör kare norm dağılımını | | X - P X | | 2 a, χ 2 ölçü parametresi ile -Dağıtım σ 2 ve özgürlük dereceleri olması umulur başka bir parametre , n - p .E(X)L||XPX||2χ2σ2np

Bu gerçeklerin ispatı taslağı aşağıda verilmiştir. İki sonuç, normal dağılıma dayalı istatistiksel teorinin daha da geliştirilmesi için çok önemlidir. Ayrıca, dağıtımının sahip olduğu parametrelere sahip olmasının nedeni de budur . Ayrıca, ölçek parametresi 2 σ 2 ve şekil parametresi ( n - p ) / 2 ile bir Γ dağılımıdır , ancak yukarıdaki bağlamda, serbestlik dereceleri cinsinden parametreleştirilmesi doğaldır.χ2Γ2σ2(np)/2

Özellikle aydınlatıcı olan Wikipedia makalesinden alıntı yapılan paragrafların hiçbirini bulamadığımı itiraf etmeliyim, ancak bunlar da gerçekten yanlış değil ya da çelişkili değil. Onlar kesin olmayan söz ve biz varyans parametresinin tahminini hesaplamak, ama çok artıklar dayalı ne zaman genel gevşek anlamda, biz boyut bir alanda değişmesine tek serbest olan bir vektör üzerinde hesaplama dayandırmak olduğu .np

Doğrusal normal modeller teorisinin ötesinde, serbestlik dereceleri kavramının kullanımı kafa karıştırıcı olabilir. Bu para- kullanılan, örneğin, bir serbestlik herhangi bir derece olabilir şey bir başvuru olup olmadığını -Dağıtım. Kategorik verilerin istatistiksel analizini düşündüğümüzde, "bağımsız parçaların" bir tablolamadan önce veya sonra sayılması gerekip gerekmediği konusunda bir karışıklık olabilir. Ayrıca, alt uzay kısıtlamaları olmayan normal modellerde bile, kısıtlamalar için, serbestlik dereceleri kavramının nasıl genişletileceği açık değildir. Tipik olarak etkili serbestlik dereceleri adı altında çeşitli öneriler mevcuttur .χ2

Başka kullanım ve özgürlük derecelerinin anlamları dikkate alınmadan önce, lineer normal modeller bağlamında kendisine güvenmenizi şiddetle tavsiye edeceğim. Bu model sınıfıyla ilgili bir referans , Lineer Model Teorisinde Bir İlk Derstir ve kitabın önsözünde doğrusal modellerdeki diğer klasik kitaplara ek referanslar vardır.

Yukarıdaki sonuçlar ispatı: olsun , varyans matris olduğuna dikkat σ 2 I ve ortonormal baz tercih Z'ye 1 , ... , z s arasında L ve ortonormal baz z p + 1 , ... , z n ve L . Daha sonra Z 1 , ... , z , n ve ortonormal baz olan R, n . Let ~ Xξ=E(X)σ2Iz1,,zpLzp+1,,znLz1,,znRnX~ifade katsayılarının -vector X bu bazda, yani ~ X- ı = Z , T i x . Bu aynı zamanda şu şekilde yazılabilir ~ X = Z , T , X burada , Z ile ortogonal matris z i 'in sütunlarında. O zaman, ˜ X'in ortalama Z T ξ ile normal bir dağılıma sahip olması gerekir, ve Z , ortogonal olduğundan, matris σ 2 I varyansınX

X~i=ziTX.
X~=ZTXZziX~ZTξZσ2I. Bu normal dağılımın genel doğrusal dönüşüm sonuçlarından kaynaklanmaktadır. Baz seçildi böylece katsayıları bu olan ~ X- ı için i = 1 , ... , p ve katsayıları x - P , X olan için . Katsayılar ilişkisiz ve ortak normal oldukları için bağımsızdırlar ve bu ve bağımsızdır. Dahası, PXX~ii=1,,pXPXi=p+1,...,n,p 2 i . KarsılıkLD(X~ii=p+1,,n X - p X = N Σ i = p + 1 ~ x i z i | | X - P X | | 2 = n i = p + 1 ˜ X
PX=i=1pX~izi
XPX=i=p+1nX~izi
||XPX||2=i=p+1nX~i2.
Eğer daha sonra için daha sonra da ve dolayısıyla . Bu durumda , bağımsız dağılımlı rastgele değişkenlerin toplamıdır, tanımı gereği dağılımı, bir scale parametresi ile dağıtılır ve serbestlik dereceleri.ξLı=p+1,...,n,ZıLziKarsılık| | X-PX| | 2n-pN(0,σ2)χ2σ2nE(X~i)=ziTξ=0i=p+1,,nziLziξ||XPX||2npN(0,σ2)χ2σ2np

NRH, Teşekkürler! (1) ) neden içinde olmak zorunda ? (2) Neden ve bağımsız? (3) Dof, rasgele değişken bağlamındaki dof, deterministik durumunda doftan tanımlanmış mı? Örneğin, nedeni dof çünkü , rastgele bir değişken yerine deterministik bir değişken olduğunda doğrudur ? (4) Sizinkiyle aynı / aynı görüşü taşıyan referanslar (kitaplar, bildiriler veya linkler) var mı? L P X X - P X | | X - P X | | 2 n - p XE(X)LPXXPX||XPX||2npX
Tim

@Tim, ve normaldir ve ilişkisiz oldukları için bağımsızdır. X - P XPXXPX
mpiktas

@Benim, cevabı biraz yeniden değerlendirdim ve belirtilen sonuçların bir kanıtını verdim. dağıtımı hakkındaki sonucu kanıtlamak için ortalamanın olması gerekir. Bu bir model varsayımıdır. Literatürde lineer normal modelleri veya genel lineer modelleri aramalısınız, ancak şu anda sadece bazı eski, yayınlanmamış ders notlarını hatırlayabiliyorum. Uygun bir referans bulabilecek miyim göreceğim. χ 2Lχ2
NRH,

Harika cevap İçgörü için teşekkürler. Bir soru: Ne ifade "ortalama vektör neyi kastettiğini kayboldu olduğu ". Açıklayabilir misin? tanımlamaya mı çalışıyorsunuz ? yi tanımlamak için ? başka bir şey? Belki de bu cümle çok fazla şey yapmaya ya da benim için özlü olmaya çalışıyor. bağlamda tanımını açıklayabilir misiniz: sadece ? Bu bağlamda ne olduğunu (normal kimliği koordinatlarının) detaylandırabilir misiniz? Sadece mi? L D L D E ( x 1 , x 2 , ... , x , n ) = ( x 1 + x 2 + + x n ) / n L L = REXLELEE(x1,x2,,xn)=(x1+x2++xn)/nLL=R
DW,

@DW , beklenti operatörüdür. Yani ait coordinatewise beklentilerinin vektörüdür . Alt uzay , nin herhangi bir -boyutlu alt . Bu, vektörlerin bir alanıdır ve kesinlikle , ama çok iyi bir boyutlu olabilir. En basit örnek, belki de -vector tarafından tüm koordinatlarında 1 olan bir yayılma olduğundadır . Bu, tüm koordinatlarının aynı ortalama değere sahip modelidir , ancak daha birçok karmaşık model mümkündür. E ( X ) X L p R n n R 1 n XEE(X)XLpRnnR1nX
NRH

30

Gerçekten, "serbestlik dereceleri" teriminin herhangi bir alanda çalışmasından hiç de farklı değil. Örneğin, dört değişkeniniz olduğunu varsayalım: uzunluk, genişlik, alan ve bir dikdörtgenin çevresi. Gerçekten dört şey biliyor musun? Hayır, çünkü sadece iki serbestlik derecesi var. Uzunluğu ve genişliği biliyorsanız, alanı ve çevreyi türetebilirsiniz. Uzunluğu ve alanı biliyorsanız, genişliği ve çevreyi elde edebilirsiniz. Alanı ve çevreyi biliyorsanız, uzunluğu ve genişliği elde edebilirsiniz (dönüşe kadar). Dördünüzün hepsine sahipseniz, sistemin tutarlı olduğunu (tüm değişkenlerin birbiriyle aynı fikirde olduğunu) veya tutarsız olduğunu (hiçbir dikdörtgenin gerçekte tüm koşulları karşılayamayacağını) söyleyebilirsiniz. Bir kare, serbest bırakılma derecesine sahip bir dikdörtgendir;

İstatistiklerde işler daha bulanık hale geliyor, ancak fikir hala aynı. Bir işlev için girdi olarak kullandığınız verilerin tümü bağımsız değişkenler ise, girdileriniz kadar serbestlik derecesine sahip olursunuz. Fakat eğer bir şekilde bağımlılıkları varsa, öyle ki, eğer n - k girdileriniz varsa, kalan k'yı anlayabilirdiniz, o zaman aslında sadece n - k serbestlik derecelerine sahip olacaksınız. Ve bazen bunu hesaba katmanız gerekir, kendinizi gerçekten bağımsız veri bitlerine sahip olduğunuzdan daha fazla veri noktası sayarak, verinin daha güvenilir olduğuna veya gerçekten olduğundan daha fazla tahmin edici güce sahip olduğuna ikna olmalısınız.

( Http://www.reddit.com/r/math/comments/9qbut/could_someone_explain_to_me_what_degrees_of/c0dxtbq?context=3 adresindeki bir yayından alınmıştır .)

Dahası, üç tanım da neredeyse aynı mesajı vermeye çalışıyor.


1
Temel olarak doğru, ancak orta paragrafın korelasyon, bağımsızlık (rastgele değişkenlerin) ve fonksiyonel bağımsızlığın (parametrelerin bir manifoldunun) kafasını karıştıracak şekilde okunabileceğinden endişe ediyorum. Korelasyon-bağımsızlık ayrımının sürdürülmesi özellikle önemlidir.
whuber

@whuber: Şimdi iyi mi?
Biostat

3
Doğru, ancak terimleri kullanma şekli bazı insanların kafasını karıştırır. Yine de rasgele değişkenlerin bağımlılığını işlevsel bağımlılıktan açıkça ayırt etmiyor. Örneğin, sıfır olmayan korelasyonlu (dejenere olmayan) bir iki değişkenli normal dağılımdaki iki değişken bağımlı olacaktır (rastgele değişkenler olarak), ancak yine de iki serbestlik derecesi sunarlar.
whuber

5
Bu, 2009 yılında yaptığım reddit yayınından kopyalanarak yapıştırıldı .
hobbs

2
Yardım Merkezimiz , başkaları tarafından yazılan malzemelere nasıl atıfta bulunacağına dair net bir rehberlik sunar ; bu nedenle, OP'nin uygun görevlerde bulunmak ve yapıcı etkileşimlere girmek için bu görevine geri döneceğini umuyorum (bir süredir onu görmüyoruz).
chl

19

İstatistiki Uygulamanın Küçük El Kitabındaki ilk cümleyi çok seviyorum . Serbestlik Derecesi Bölüm

Bir uygulayıcının matematiksel olarak karmaşık olmayan bir izleyici kitlesinden en çok korktuğu sorulardan biri, "Özgürlük derecesi tam olarak nedir?"

Bu bölümü okumaktan serbestlik dereceleri hakkında gerçekten iyi bir anlayışa sahip olabileceğinizi düşünüyorum.


6
Özgürlük derecesinin neden önemli olduğu değil, neden önemli olduğu konusunda bir açıklama yapmak güzel olurdu . Örneğin, 1 / n ile varyansın tahmininin önyargılı olduğunu ancak 1 / (n-1) kullanılmasının tarafsız bir tahminci sağladığını göstermek.
Tristan

9

Wikipedia , rastgele bir vektörün serbestlik derecelerinin , vektör alt uzayının boyutları olarak yorumlanabileceğini iddia eder . Vikipedi girişinde kısmi bir cevap ve detaylandırma olarak çok temelde adım adım ilerlemek istiyorum.

[abc]T[111]Tx¯=1/3(a+b+c)[x¯x¯x¯]T1[111]T1degree of freedom(n1)n1degrees of freedomn3R3[x¯x¯x¯]T[abc]T[x¯x¯x¯]T

[x¯x¯x¯][ax¯bx¯cx¯]=

=[(a+b+c)3(a(a+b+c)3)]+[(a+b+c)3(b(a+b+c)3)]+[(a+b+c)3(c(a+b+c)3)]

=(a+b+c)3[(a(a+b+c)3)+(b(a+b+c)3)+(c(a+b+c)3)]

=(a+b+c)3[13(3a(a+b+c)+3b(a+b+c)+3c(a+b+c))]

=(a+b+c)3[13(3a3a+3b3b+3c3c)]=0

Ve bu ilişki ortogonal düzlemde herhangi bir noktaya kadar uzanır. [x¯x¯x¯]T1σ2((X1X¯)2++(XnX¯)2)χn12

[355080]T55[555555]T55x+55y+55z=DD=9075

55[111]T55R22degrees of freedomR3[555555]T

[555555]T[355080]T[80805][901560]2df55[111]T1df[555555]T


9

Sınıflarımda, merak etmenize ve belki de bir serbestlik derecesinin ne anlama gelebileceği konusunda bir bağırsak hissi geliştirmenize yardımcı olabilecek bir "basit" durum kullanıyorum.

Bu konuya bir "Forrest Gump" yaklaşımı gibi, ama denemeye değer.

X1,X2,,X10N(μ,σ2)μσ2

μσ2μμμX¯

σ2σ2X1X10

μσ2μμσ2

μX¯μX¯σ2S2σ

μσ2X¯μS2σ2

Fakat farklı yanlış seviyelerde olabilirsiniz, biraz yanlıştan gerçekten çok ama çok yanlış derecede yanlış (yani, "Güle güle, maaş çeki; gelecek hafta görüşürüz!").

X¯μS2=2S2=20,000,000σ2σ2X¯ değişmek için.

μσ2μσ2

Bunu nasıl fark edebilirsiniz?

μσ

Ve işte bu, bu lirjik masalın can sıkıcı arsası: Bahsini yaptıktan sonra size anlatıyor . Belki sizi aydınlatmak, belki hazırlamak, belki alay etmek. Nasıl bilebilirsin?

μσ2X¯S2μσ2

μX¯(X¯μ)

XiN(μ,σ2)X¯N(μ,σ2/10)(X¯μ)N(0,σ2/10)

X¯μσ/10N(0,1)
μσ2

μ(Xiμ)N(0,σ2)μX¯XiX¯Var(X¯)=σ2/10<σ2=Var(Xi)X¯μXi

(Xiμ)/σN(0,1)μσ2

μσ2

[İkincisini düşündüğünüzü düşünmeyi tercih ederim.]

Evet var!

μXiσ

(Xiμ)2σ2=(Xiμσ)2χ2
Z2ZN(0,1)μσ2

(X¯μ)2σ2/10=(X¯μσ/10)2=(N(0,1))2χ2
i=110(Xiμ)2σ2/10=i=110(Xiμσ/10)2=i=110(N(0,1))2=i=110χ2.
X1,,X10). Bu tek tek Ki-kare dağılımının her biri, kabaca toplama katkısı ile aynı miktarda katılımı beklediğiniz rastgele değişkenlik miktarına bir katkıdır.

Her katkının değeri matematiksel olarak diğer dokuzla eşit değildir, ancak hepsinin dağılımda beklenen aynı davranışı vardır. Bu anlamda, onlar bir şekilde simetriktir.

Bu karelerden her biri, bu toplamda beklediğiniz saf, rastgele değişkenlik miktarına bir katkıdır.

100 gözleminiz olsaydı, yukarıdaki toplamın daha fazla rekabet kaynağı olduğu için daha büyük olması beklenirdi .

Aynı davranışa sahip bu "katkı kaynakları" nın her birine serbestlik derecesi denilebilir .

Şimdi bir veya iki adımı geri alın, serbest bırakma derecenizin istendiği aniden gelmesi için gerekirse önceki paragrafları tekrar okuyun .

μσ2

Mesele şu ki, eşdeğer 10 değişkenlik kaynağının davranışına güvenmeye başladınız. 100 gözleminiz olsaydı, o toplamda tamamen rastgele dalgalanma olan 100 bağımsız, eşit davranışlı kaynağınız olurdu.

χ102χ12

μσ2

μσ2

Tanrı'ya karşı isyan ettiğinizde ve O'nun sizi harekete geçirmesini beklemeden, tek başınıza geçinmeye çalıştığınızda, her şey garipleşmeye başlar (Hahahaha; ancak şimdi!).

X¯S2μσ2

Yukarıdaki toplamı ile hesaplamayı düşünebilirsiniz.X¯S2μσ2

i=110(XiX¯)2S2/10=i=110(XiX¯S/10)2,

μ(Xiμ)>0i=110(Xiμ)>0i=110(XiX¯)=0i=110Xi10X¯=10X¯10X¯=0

i=110(XiX¯)2i=110(Xiμ)2

XiX¯S/10
(XiX¯)2S2/10
i=110(XiX¯)2S2/10
X¯μS/10

"Hepsi boşuna mıydı?"

i=110(XiX¯)2σ2=i=110[Xiμ+μX¯]2σ2=i=110[(Xiμ)(X¯μ)]2σ2=i=110(Xiμ)22(Xiμ)(X¯μ)+(X¯μ)2σ2=i=110(Xiμ)2(X¯μ)2σ2=i=110(Xiμ)2σ2i=110(X¯μ)2σ2=i=110(Xiμ)2σ210(X¯μ)2σ2=i=110(Xiμ)2σ2(X¯μ)2σ2/10
i=110(Xiμ)2σ2=i=110(XiX¯)2σ2+(X¯μ)2σ2/10.

İlk terim, 10 derece serbestlik derecesine sahip Ki-kare dağılımına ve son terim, bir serbestlik derecesine sahip Ki-kare dağılımına (!) Sahiptir.

İki bölüme eşit, bağımsız davranan 10 bağımsız değişkenlik kaynağına sahip bir Ki-kareyi iki bölüme ayırdık, her ikisi de pozitif: bir bölüm, bir değişkenlik kaynağına sahip bir Ki-kare ve diğeri kanıtlayabiliyoruz (inanç sıçraması WO? ) aynı zamanda 9 (= 10-1) bağımsız eşit davranışlı değişkenlik kaynağına sahip bir Ki-kare, her iki bölüm birbirinden bağımsız olmalıdır.

Bu zaten iyi bir haber, çünkü şimdi dağıtımımız var.

σ2

S2=1101i=110(XiX¯)2,
i=110(XiX¯)2σ2=i=110(XiX¯)2σ2=(101)S2σ2χ(101)2
X¯μS/10=X¯μσ/10Sσ=X¯μσ/10S2σ2=X¯μσ/10(101)S2σ2(101)=N(0,1)χ(101)2(101),
(101)

t

[^ 1]: @whuber, aşağıdaki yorumlarda Gosset'in matematik yapmadığını ancak bunun yerine tahmin ettiğini söyledi ! O zaman için hangi başarın daha şaşırtıcı olduğunu gerçekten bilmiyorum.

t(101)X¯μS2X¯

İşte gidiyorsun. Çok fazla teknik ayrıntı ile halının arkasına kabadayı sarıldı, ancak yalnızca tüm maaşınızı tehlikeye atmak için Tanrı'nın müdahalesine bağlı değil.


1
1010

Değerlendirmeniz için çok teşekkürler, @whuber! Yazdıklarını unuttuğunda bir kaç yazım hatası ortaya çıkıyor. Değerlendirmenizle ilgili olarak, sadece bir anlamda biraz daha az matematiksel olan başka bir düşünce biçimini göstermeyi amaçladım. Ayrıca, ne demek istediğinizi tam olarak anlamadım. Bunun yerine, 10 bağımsız ki-kare değişkeni yerine 10 bağımsız normal değişkeni toplamış olsaydınız , kilit noktanızı tuttuğunu tahmin ettiğim bir normal değişkenle sonuçlanırdı. . Gönderiyi iyileştirmeyi ümit ederek, bu konuda ayrıntılı bilgi vermeye çalışacağım.
Marcelo Ventura

2

Serbestlik derecelerinin sezgisel bir açıklaması , ilgilenilen bir parametrenin (yani bilinmeyen miktarın) tahmin edilmesi için verilerde bulunan bağımsız bilgi parçalarının sayısını temsil etmeleridir .

Örnek olarak, formun basit bir doğrusal regresyon modelinde:

Yi=β0+β1Xi+ϵi,i=1,,n

ϵiσβ0β1nn2n2σ


Cevabımdaki düzenlemeleriniz için çok teşekkürler, @ COOLSerdash!
Isabella Ghement

2

nX1,,Xni=1n(XiX¯n)2Xn12X¯n=1ni=1nXin1(X¯n=1ni=1nXi)

Daha fazla bilgi için bkz: bu


0

Benim için anladığım ilk açıklama şuydu:

Ortalama veya varyasyon gibi bir istatistiksel değer biliyorsanız, her değişkenin değerini bilmeden önce bilmeniz gereken kaç değişken verisi vardır?

Bu, A3xa'nın söylediği gibidir, ancak herhangi bir veri noktasına özel bir rol vermeden ve cevabında verilen üçüncü duruma yakındır. Bu şekilde aynı örnek şöyle olacaktır:

Verilerin ortalamasını biliyorsanız, tüm veri noktalarının değerini bilmek için bir veri noktası dışındaki herkesin değerlerini bilmeniz gerekir.


Değişkenler -> gözlemler
Richard Hardy,

0

xyVx,y=Vx+VyVx=SDx2Vx,ySDx,y=SDx2+SDy2SDx=i=1n(xix¯)2n1n=1x1x¯=0i=1n(xix¯)2n100xn=2x1x2x¯=x1+x22x¯x1x2nx¯nn1

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.