Regresyon artık dağılım varsayımları


12

Dağılım varsayımını hatalara neden koymak gerekir?

ϵ iN ( 0 , σ 2 )yi=Xβ+ϵi , .ϵiN(0,σ2)

Neden yazmıyorsun

y ı ~ N ( X, β , σ 2 )yi=Xβ+ϵi , ,yiN(Xβ^,σ2)

burada her iki durumda da . Dağıtım varsayımlarının veriye değil hatalara yerleştirildiğini, açıklama yapmadan vurguladığını gördüm . ϵi=yiy^

Bu iki formülasyon arasındaki farkı gerçekten anlamıyorum. Verilere dağıtım varsayımlarının yerleştirildiğini gördüğüm bazı yerler (Bayesian yanıyor. Çoğunlukla görünüyor), ancak çoğu zaman varsayımlar hatalara yerleştirilir.

Modelleme yapılırken, neden biri ya da diğeri üzerindeki varsayımlarla başlamayı seçmeliyiz?


Birincisi, "gerekli" değil, ne yapmak istediğinize bağlı. Bazı iyi cevaplar var, ama sanırım X'in y'ye "neden olduğu" anlamında temel nedensel varsayım var ve ona bu şekilde bakarsanız y dağılımının "neden" olduğunu görürsünüz. Rh'lerin dağılımı, yani X'ler ve hatalar (varsa). Çok sınırlı dağılımsal varsayımlarla ve özellikle normallik olmadan bol miktarda ekonometri yapabilirsiniz. Tanrıya şükür.
PatrickT

3
XβyD( y )=E(y)=Xβy^ , değildir ve popülasyon ortalaması, bunun örnek tahmini ile aynı değildir. Yani ikinci şey aslında birinciyle aynı şey değildir, ancak beklentisiyle değiştirirseniz ( ), ikisi eşdeğer olacaktır. XβyE(y^)=E(y)=Xβ
Glen_b -Manica Monica

Ne ? Ve ile değişirse , neden değişmez ? Lütfen kullanmak istediğiniz notasyonu, vektörü veya matrisi aklınızdan çıkarmayın. Şimdi olduğunu varsayarsak, olmaktan daha fazla: , yani dağılımını kendisi ve diğer tüm gözlemler açısından tanımlarsınız ! yııXy^yiiy = x β y ı ~ N ( X ' i ( Σ x j X ' j ) - 1 Σ x j y j , σ 2 ) y ı y jXβy^=Xβ^yiN(xi(xjxj)1xjyj,σ2)yiyj
mpiktas

1
Soruyu reddettim çünkü gösterimin kafa karıştırıcı olduğunu düşünüyorum ve bu zaten birbiriyle çelişen birkaç cevapla sonuçlandı.
mpiktas

Yanıtlar:


9

Doğrusal bir regresyon ayarında üzerinde koşullu , yani "verilerde" koşullu analiz yapmak ve sonuç çıkarmak yaygındır . Bu nedenle, ihtiyacınız olan şey normal, yani normal olmak için ihtiyacınız var . Peter FLOM en örneğinde de olduğu gibi bir normallik olabilir normalliği kalmadan ne gerek normalliği olduğundan, dolayısıyla, ve mantıklı bir varsayım.y X ϵ ϵ y ϵXyXϵϵyϵ


9

İkinci tanımı şöyle yazarım

yiN(Xiβ,σ2)

veya (Karl Oskar'ın +1 önerdiği gibi)

yi|XiN(Xiβ,σ2)

yani modelleme varsayımı, cevap değişkeninin normal olarak sabit varyans ile regresyon çizgisi etrafında dağıtılmasıdır (koşullu ortalamanın bir tahminidir) . Bu, normal olarak dağıtıldığını aynı şey değildir , çünkü dağılımın ortalaması bağlıdır .σ2yiXi

Makine öğrenimi literatüründe buna benzer formülasyonlar gördüğümü düşünüyorum; görebildiğim kadarıyla ilk tanıma eşdeğerdir, tek yaptığım ikinci formülasyonu ve 'ları ortadan kaldırmak için biraz farklı bir şekilde yeniden basmaktır .ϵiy^


3

Fark bir örnekle açıklamak en kolay yoldur. İşte basit bir tane:

Y'nin bimodal olduğunu ve modalitenin bağımsız bir değişken tarafından açıklandığını varsayalım. Örneğin, Y'nin yükseklik olduğunu ve örneğinizin (herhangi bir nedenle) jokeylerden ve basketbolculardan oluştuğunu varsayalım. örneğinR

set.seed(123)
tall <- rnorm(100, 78, 3)
short <- rnorm(100, 60, 3)

height <- c(tall, short)
sport <- c(rep("B", 100), rep("H",100))

plot(density(height))

m1 <- lm(height~sport)
plot(m1)

ilk yoğunluk çok normal değildir. Ancak modelin kalıntıları normale çok yakın.

Kısıtlamaların neden bu şekilde uygulandığına gelince - başkasının buna cevap vermesine izin vereceğim.


1
Teşekkür ederim! İki modlu bir dağılımla ne demek istediğini anlıyorum. Takip eden soru: Verilerin varyansları farklıysa (heterosdadastisite?) Diyelim ki ... tüm jokeyler küçük haklıdır, ancak basketbolcuların yükseklikleri çok değişir. Belki onlar için uzun boylu <- rnorm (100,78,10). Böyle bir durum veya ilgili varsayımlarınızı nasıl değiştirir ? yiϵi
bill_e

Bu durumda, hetero-esneklik bir sorun olacaktır ve başka bir regresyon biçimi veya muhtemelen bir dönüşüm kullanmanız gerekir, ya da başka bir değişken ekleyebilirsiniz (bu aptal örnekte, basketbolda oynanan pozisyon bunu yapabilir).
Peter Flom - Monica'yı eski durumuna döndürün

Formülasyonun, normal şartlı dağılımları olduğu için, ys'nin normal olarak dağıtıldığını öne sürdüğünden emin değilim.
Dikran Marsupial

2

İkinci formülasyonunuza şüpheli bir i eklemeniz gerekir: çünkü ile birlikte değişebilmelidir .

yiN(y^i,σε2)
y^xi

Belirtilen, nedir? dır . Bu, @DikranMarsupial'in şu formülasyonuna yol açar: Bunun aynı olduğunu fark etmeye değer formülasyon, çünkü hem normal dağılımları öngörür hem de beklenen değerler eşittir. Yani: (Ve açıkça varyanslar eşittir.) Başka bir deyişle, buy^ixiβ^

yiN(xiβ^,σε2)

E[xiβ^]=E[xiβ^+E[N(0,σε2)]]=E[xiβ^+0]=E[xiβ^]
varsayımlarda bir fark değil , basitçe notasyonel bir farktır.

Böylece soru, ilk formülasyonu kullanarak fikri sunmayı tercih etmek için bir neden var mı?

Cevabın iki nedenden dolayı evet olduğunu düşünüyorum :

  1. İnsanlar genellikle ham verilerin normal olarak dağıtılması (yani ) veya / koşullu verilerin normal olarak dağıtılması (örneğin, / ) olup olmadığını karıştırırlar. : Kalanlar normal olarak dağıtılırsa, ancak y dağıtılmazsa ne olur?X Y | X εYXY|Xε
  2. İnsanlar genellikle bağımsız olması gereken şeyi, ham verileri veya hataları karıştırırlar. Dahası, sık sık bir şeyin iid olması gerektiğinden (bağımsız ve aynı şekilde dağıtılmış) söz ediyoruz; açısından düşünüyorsanız, başka bir potansiyel karışıklık kaynağı olabilir, çünkü bağımsız olabilir, ancak boş hipotez geçerli olmadığı sürece aynı şekilde dağıtılamaz (ortalama değişebilir). Y | XY|XY|X

Bu karışıklıkların ikinci formülasyonu kullanma olasılığının birinciden daha fazla olduğuna inanıyorum.


1
@Glen_b, yorumunu takip etmiyorum. Benim iddia bu değil eşittir , fakat daha ziyade bu eşittir . Gözlemleri indeksleyen abone konuyla ilgilidir. Fikir, belirli bir gözlem için tahmin edilen değerinin . Bunun nüfus ortalaması ile ilgisi yoktur . (Görünüşe göre, betalarıma şapka eklemeyi unutmuşum; şimdi düzelttim.) Xβ y ixi β i y ixi β -Yy^Xβy^ixiβ^iy^ixiβ^Y
gung - Monica'yı eski

@Glen_b örnek olsaydı , yerine olacağı anlamına gelir . Başlangıçta gösterimi de kafa karıştırıcı buldum, ancak , ve . Bunların her ikisinin de doğru olması için yalnızca . y y =xβyi=xβ+εiεi=yı - y y xβy¯y^y^=Xβyi=Xβ+ϵiϵi=yiy^y^Xβ
Dikran Marsupial
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.