Doğrusal regresyon, koşullu beklentiler ve beklenen değerler


11

Pekala, birkaç şeye biraz puslu, herhangi bir yardım çok takdir edilecektir. Anladığım kadarıyla, doğrusal regresyon modelinin koşullu bir beklenti ile tahmin edildiği

E(Y|X)=b+Xb+e
  1. Biz de farz mı ve bilinmeyen olasılık dağılımıyla rasgele değişkenlerdir? sadece artıkların ve tahmini beta katsayılarının rasgele değişkenler olduğu anlayışımdı. öyleyse, örnek olarak, obezite ve yaş ise, koşullu beklentiyi anlamına alırsak , birey örnekte ise obez olmanın beklenen değeri ne olur? yalnızca bu gözlemler için y'nin ortalama (aritmetik ortalama) almak ? ancak beklenen değer, bunu meydana gelme olasılığı ile çarpmamız gerektiğini gerektirmiyor mu? ama bu anlamda olasılığını nasıl bulabilirizXYY=X=E(Y|X=35)35XX=35Xgibi bir değeri temsil ederse oluşan yüksek değerli değişken?
  2. döviz kuru gibi bir şeyi temsil ediyorsa , bu rasgele olarak sınıflandırılır mı? Olasılıkları bilmeden bunun beklenen değerini nasıl bulabilirdiniz? ya da beklenen değer sınırdaki ortalamaya eşit olur.X
  3. Bağımlı değişkenlerin kendilerinin rastgele değişken olduğunu varsaymazsak, olasılığı göz ardı etmediğimizden, ne olduklarını varsayıyoruz? sabit değerler falan mı? ancak bu durumda, rastgele olmayan bir değişkeni nasıl başlatabiliriz? bağımsız değişkenlerin dağılımı hakkında ne varsayıyoruz?

Bir şey anlam ifade etmiyorsa veya kimseye açık değilse özür dilerim.


1
Regresyon katsayısı , rastgele bir değişken değil (en azından sıkça kullanılan bir dünyada) bilinmeyen bir sabittir. β
Richard Hardy

koşullu beklentilerle ne demek istiyorsun? E (Y | X) basitçe X verilen Y anlamına gelir, yani Y'nin X'deki beklenen değeri. Diyelim ki, y = 5 + x, o zaman E (Y | X = 5) 10'dur. koşullu beklenti
Zamir Akimbekov

@RichardHardy, B'nin betaların örnekleme dağılımının ortalaması olduğu için normal dağılımla karakterize rastgele bir değişken olduğu anlayışımdı. nüfus modelinden mi bahsediyorsun?
William Carulli

Evet, nüfus modeli.
Richard Hardy

1
@WilliamCarulli Richard bir popülasyon parametresi ile tahmini bir parametre arasındaki farka atıfta bulunuyor . Tahmini parametre gerçekten rastgele bir değişkendir, ancak (bilinmeyen) gerçek nüfus parametresi sabit bir değerdir.
Matthew Drury

Yanıtlar:


8

Doğrusal regresyon altında yatan olasılık modelinde, X ve Y olan rastgele değişkenler.

öyleyse, örnek olarak, Y = obezite ve X = yaş ise, koşullu beklentiyi E (Y | X = 35) anlamına alırsak, birey örnekte 35 ise obez olmanın beklenen değeri ne olur? X = 35 olduğu gözlemler için y'nin ortalamasını (aritmetik ortalama) almanız yeterlidir.

Doğru. Genel olarak, X'in her bir belirli değerinde yeterli veriye sahip olmanızı bekleyemezsiniz veya X sürekli bir değer aralığı alabilirse bunu yapmak imkansız olabilir. Ancak kavramsal olarak, bu doğrudur.

ancak beklenen değer, bunu meydana gelme olasılığı ile çarpmamız gerektiğini gerektirmiyor mu?

Koşulsuz beklenti ile koşullu beklenti E [ Y X = x ] arasındaki farktır . Aralarındaki ilişkiE[Y]E[YX=x]

E[Y]=xE[YX=x]Pr[X=x]

toplam beklentinin kanunu.

ama bu anlamda X-değeri değişkeninin yaş gibi bir şeyi temsil etmesi olasılığını nasıl bulabiliriz?

Genellikle lineer regresyonda değilsiniz. belirlemeye çalıştığımızdan , P r [ X = x ]' ı bilmemiz gerekmez .E[Y|X]Pr[X=x]

Bağımsız değişkenlerin kendilerinin rastgele değişken olduğunu varsaymazsak, olasılığı göz ardı etmediğimizden, ne olduklarını varsayıyoruz? sabit değerler falan mı?

Biz do Y rastgele değişken olduğunu varsayalım. Doğrusal regresyonu düşünmenin bir yolu, Y için bir olasılık modeli olarakY

Y~Xβ+N-(0,σ)

Bu, X'in değerini öğrendikten sonra, Y'deki rastgele varyasyonun toplamıyla sınırlı olduğunu söyler .N-(0,σ)


Yorumunuz için çok teşekkür ederim, bana çok yardımcı oldu. şerefe.
William Carulli

@WilliamCarulli Rica ederim! Herhangi bir takip sorusu sormaktan çekinmeyin, cevaplamak için elimden geleni yapacağım. Tüm sorunlarınızı gerçekten çözdüysem de kabul edebilirsiniz.
Matthew Drury

3
Bu güzel bir gönderi. Bununla birlikte, (a) 'nın sabitlenebileceğini veya (b) rastgele bir değişken olabileceğini kabul etmeyen herhangi bir cevabın (özellikle bağımsızlık varsayımlarıyla), soruda ifade edilen endişeleri gerçekten ele almadığını düşünüyorum. X
whuber

@MatthewDrury, Sadece açıklığa kavuşturmak için, eğer bağımlı değişkenim döviz kurunu söylüyorsa ve bağımlılığım yurtiçi faiz oranı ise, o zaman
William Carulli

@ MatthewDrury @ MatthewDrury, Sadece açıklığa kavuşturmak için, bağımlı değişkenim döviz kurunu söylüyorsa ve bağımlılığım iç faiz oranı ise, E (E (döviz kuru | faiz oranı)) = E (döviz kuru) = örnek ortalama döviz kuru? Beni kafa karıştırıcı olan şey, beklentilerin olasılıklara dayalı olarak hesaplandığını varsaydığımı tahmin ediyorum, matris cebiri ile çözüldüğünde doğrusal regresyonu koşullu bir beklenti olarak gösterme nedenini genel beklentiden çok daha farklı görünüyor.
William Carulli

3

Bu sorunun bir sürü yanıtı olacak, ancak bazı ilginç noktalar yaptığınızdan beri hala bir tane eklemek istiyorum. Basitlik için sadece basit doğrusal modeli düşünürüm.

   It is my understanding that the linear regression model
   is predicted via a conditional expectation E(Y|X)=b+Xb+e

E(Y|X)=β0+β1X,
YXβ0β1
Y=β0+β1X+ε,
εE(ε)=0
Do we assume that both X and Y are Random variables with some unknown 
probability distribution? ... If we don't assume the independent variables 
are themselves random 

XY

{X1,...,Xn}X

β0β1XX

if we take the conditional expectation E(Y|X=35) ... would we just take 
the average(arithmetic mean) of y for those observations where X=35?

φ^(x)E(Y|X=x)β^0β^1

φ^(x)=β^0+β^1x

Koşullu ortalama en az kare tahmin edicinin, modeliniz farklı ağırlıkları tek bir faktörün seviyeleri olarak ele alırsa, tanımladığınız ifadeye eşit bir ifadeye sahiptir. Bu modeller aynı zamanda (basit değil) doğrusal modelin özel bir örneği olan tek yönlü ANOVA olarak da bilinir.

1
Xβ^0β^1X

1
@whuber "İlk olarak, model" doğrusal "olarak adlandırılır çünkü parametrelerde doğrusaldır" Ben "doğrusal model" de "doğrusal" anlamını değil denklemin anlamını açıklıyordum. "β̂ 0 ve β̂ 1 tahminleri X ile ilgili varsayımdan bağımsız olarak rastgele değişkenlerdir", ancak bu rastgele değişkenlerin dağılımı X'e nasıl davrandığınıza bağlı olarak değişir.
Mur1lo

1
@whuber Son noktalarınıza tamamen katılıyorum. Cevabımı düzenleyeceğim, böylece işaret ettiğiniz tüm konularda daha net. Geri dönüşünüz için teşekkür ederiz.
Mur1lo
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.