Doğrusal ve lojistik regresyon için hata dağılımı


9

Sürekli verilerde, doğrusal bir regresyon hata teriminin dağıtıldığını N (0, ) varsayar.Y=β1+β2X2+uσ2

1) Var'ın (Y | x) aynı şekilde ~ N (0, σ2 ) olduğunu düşünüyor muyuz ?

2) Lojistik regresyonda bu hata dağılımı nedir? Veriler, vaka başına 1 kayıt biçiminde olduğunda, "Y" 1 veya 0 olduğunda, dağıtılan Bernoulli hata terimi (yani varyans p (1-p))) ve veriler # biçimindeyken denemelerden elde edilen başarıların binom olduğu varsayılmaktadır (yani varyans np (1-p)), burada p Y'nin 1 olma olasılığıdır?


2
Model varsayımı, hata terimlerinin bağımsız olduğu ve N (0, σ ) ve COVARIATE ile ilgisi olmayan bir dağıtımla özdeş olarak dağıtıldığı şeklindedir. Var (Y | x) nedir? X = x üzerinde koşullandırma yapıyorsunuz ? Model, ortak değişkenin bir şekilde rastgele olduğunu mu varsayıyor? Ben ikincisi olduğunu düşünüyorum ve bu nedenle Var (Y | X = x) varsayımlar tarafından ima edilir ve varsayılması gerekmez. 222
Michael R. Chernick

@MichaelChernick Neden modeli olduğunu varsayalım sabittir? Sabit olduğu durum kesinlikle olabilir , ancak rastgele da olabilir. Soruda yer alan hiçbir şey benim için birini ima etmiyor. X2
Peter Flom

@PeterFlom Varsayılan hata dağılımı ile doğrusal regresyonun X sabitlenmesini ve bilinmesini gerektiren OLS anlamına geldiği sorusunu okudum . Birisi Deming regresyonuna sahipse (yani değişken regresyonunda hata) soruda belirtilir. Stat'ın verdiği cevaba bakıldığında, soruyu da bu şekilde iç içe geçirdiğini gösterir. 2
Michael R. Chernick

@Michael, sabit X varsayıyordum
B_Miner

Yanıtlar:


10

1) Eğer yani normal dağılımına sahip daha sonra , çünkü rastgele bir değişken değil.uN(0,σ2)Var(Y|X2)=Var(β1+β2X2)+Var(u)=0+σ2=σ2β1+β2X2

2) Lojistik regresyonda, hataların burada belirtildiği gibi bir binom dağılımını izlediği varsayılmaktadır . olarak yazmak daha iyidir , bu olasılıklar burada veya Uygulamalı Lojistik Regresyonda atıfta bulunulan bağlıdır .Var(Yj|Xj)=mj.E[Yj|Xj].(1E[Yj|Xj])=mjπ(Xj).(1π(Xj))Xj


Stat, Yani, i'inci bireysel hata için varyans, söylemek doğrudur olduğu (1- aynı ortak değişken ile verilerinde 1'den fazla gözlem olduğunu varsayarak göstermiştir neyi eşdeğerdir) (yani tüm j için = 1)? ebenpbenpbenmj
B_Miner

2
Evet bu doğru. Eğer ile , daha sonra olasılığı ile veya olasılığı ile . Dolayısıyla , ortalama ve eşit varyansa sahip bir dağılıma sahiptir . Yben=pben+ebenP(Yben=1)=1-P(Yben=0)=pbeneben=1-pbenpbeneben=-pben1-pbeneben0pben(1-pben)
Stat

Buradaki ek bir nokta, Stat, X'in sabit olduğunu varsaymak zorundayız, Var (Y | X) = Var (e) için hem doğrusal hem de lojistik regresyon vakaları için doğru değil mi?
B_Miner

Not olasılığı ile veya olasılığı ile olan olmayan bir binom dağılımını . ei=1pipiei=pi1piei
Scortchi - Monica'yı eski durumuna döndürün

B_Miner: varyansını anlamına gelir rastgele değişken şartına s gözlemlenen bir değer alarak' . Bu nedenle, yordayıcılarınızın bir deneyle sabitlenip sabitlenmediği veya bir örnekte gözlemlenip görülmediği önemsizdir: @ Stat'un söyledikleri, artık regresyon amacıyla rastgele değişkenler olarak görülmemektedir. var(Y|X)=var(Y|X=x)YXx
Scortchi - Monica'yı eski durumuna döndürün
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.