Hata teriminin dağılımı, yanıtın dağılımını nasıl etkiler?


14

Ben hata terimlerinin normal doğrusal regresyon dağıtılır farz olduğunda Yani, tepki değişkeni için ne anlama geliyor ?y

Yanıtlar:


7

Belki gidiyorum ama hakkında merak etmemiz gerektiğini düşünüyorum , OP'yi böyle okuyorum. En basit doğrusal regresyon durumunda, modeliniz ise, modelinizdeki tek stokastik bileşen hata terimidir. Bu şekilde örnekleme dağılımını belirler . Eğer daha sonra . @Aniko'nun söyledikleri kesinlikle (marjinal olarak üzerinde ) için doğrudur . Öyleyse, soru biraz belirsiz.y = X β + ϵ y ϵ N ( 0 , σ 2 I ) y | X , β N ( X β , σ 2 I ) f ( y ) X , βf(y|β,X)y=Xβ+ϵyϵN(0,σ2I)y|X,βN(Xβ,σ2I)f(y)X,β


Tüm yorumları beğendim! Ve hepsi haklı görünüyor. Ama ben sadece en kolay cevabı arıyordum :) Errer teriminin normal dağıldığını varsaydığınızda ne olur? Bunun gerçekte çok sık meydana geldiği diğer cevaplardan açıkça anlaşılıyor! Çok teşekkürler!
MarkDollar

17

Kısa cevap size dağılımı hakkında bir şey sonucuna varamayız ki o dağılımına bağlı olduğundan, x 'in ve ilişkinin gücü ve şekli. Daha resmi olarak, y pratikte hemen hemen her şey olabilen bir "normal karışım" dağılımına sahip olacaktır.yxy

Bunu açıklamak için iki uç örnek:

  1. Sadece iki olası değeri olduğunu varsayalım , 0 ve 1 ve y = 10 x + N ( 0 , 1 ) . Sonra y 0 ve 10'da çarpmalarla kuvvetli bir bimodal dağılımına sahip olacaktır.xy=10x+N(0,1)y
  2. Şimdi aynı ilişkiyi varsayalım, ama 0-1 aralığında çok sayıda değerle eşit olarak dağıtılsın. Daha sonra y neredeyse 0-10 aralığında eşit olarak dağıtılacaktır (kenarlarda yarı normal kuyruklarla).xy

Aslında, her dağılım normalin karışımı ile keyfi olarak iyi tahmin edilebildiğinden, için gerçekten herhangi bir dağılım elde edebilirsiniz .y


8
+1 Son ifadeyi tekrar et: Bir keresinde bunu düşünme hatasını da yaptım. Matematiksel olarak haklısınız, ancak pratikte, normallerle (J- veya U-şekilli dağılımlar gibi) ayırt edilemeyen bir artışa yaklaşmak neredeyse imkansızdır: normaller, sivri uçlardaki yoğunluğu yakalamak için piklerinde çok düzdür. Çok fazla bileşene ihtiyacınız var. Normaller, pdf'leri çok düzgün olan dağılımları tahmin etmek için iyidir.
whuber

1
@whuber Kabul etti. Pratikte herhangi bir dağılım için normal karışım yaklaşımı kullanmanızı tavsiye etmem, sadece aşırı bir karşı örnek vermeye çalışıyordum.
Aniko

5

Hata terimini gerçek verilere hayali bir model koyarak icat ediyoruz; hata teriminin dağılımı, yanıtın dağılımını etkilemez.

Sıklıkla hatanın normal bir şekilde dağıtıldığını varsayıyoruz ve bu nedenle modeli, tahmini kalıntılarımız normal olarak dağıtılacak şekilde oluşturmaya çalışıyoruz. Bazı dağılımları için bu zor olabilir . Bu durumlarda, yanıtın dağılımının hata terimini etkilediğini söyleyebiliriz.y


2
yXβ^Xβ^E(y)=Xβ

Hassasiyetinize katılıyorum, JMS. +1 ve cevabımı ayarlayacağım.
Thomas Levine

2

y=m+e
myeym=eN(0,σ2)σσCauchy(0,γ)

memeyy=m+e=(m+b)+(eb)=m+e. Bir hata dağılımı ve bir model denkleminin atanması temel olarak hangi keyfi vektörlerin diğerlerinden daha makul olduğunu söyler.


H0:yf0H1:yf1

nyiYxiY=Xβ+ϵϵY|β,X

@JMS - Sanırım ilk paragrafı silebilirim. Cevabıma bir şey kattığını sanmıyorum (karışıklığın yanı sıra).
olasılık

cevaplarıma eklemek için en sevdiğim şeylerden biri :)
JMS
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.