Pisagor teoremi olarak toplam varyans kanunu


15

X ve Y sonlu ikinci momentleri olduğunu varsayın . İkinci sonlu an ile rastgele değişkenlerin Hilbert boşluğa (iç ürün ile T1,T2 ile tanımlanan E(T1T2) , ||T||2=E(T2) ), biz yorumlayabilir E(Y|X) projeksiyonu olarak Y fonksiyonları alan üzerine .X

Ayrıca Toplam Varyans Yasasının

Var(Y)=E(Var(Y|X))+Var(E(Y|X))

Bu yasayı yukarıdaki geometrik resim açısından yorumlamanın bir yolu var mı? Bana, kenarları olan dik açılı üçgen için Pisagor Teoremi ile aynı olduğu söylendi . Üçgenin neden dik açılı olduğunu anlıyorum, ancak Pisagor Teoreminin Toplam Varyans Yasasını nasıl yakaladığını değil.Y,E(Y|X),YE(Y|X)

Yanıtlar:


7

E[YX] ve YE[YX] ' un ilişkisiz rasgele değişkenler olduğu için dik açılı üçgeni dikkate alma konusunda rahat olduğunuzu varsayıyorum . İlintisiz rastgele değişkenler için A ve B ,

(1)var(A+B)=var(A)+var(B),
biz ayarlanır ve bu durumda A=YE[YX] veB=E[YX] böyleceA+B=Y ,
(2)var(Y)=var(YE[YX])+var(E[YX]).
O göstermek kalıyor İle aynıdır E [ var ( Y | X ) ] bu yüzden ki yeniden belirlemek ( 2 ) olarak var ( Y ) = E [ var ( Y | X ) ] + var ( E [ Y | X ] ) toplam varyans formülüdür.var(YE[YX])E[var(YX)](2)
(3)var(Y)=E[var(YX)]+var(E[YX])

Bu rastgele değişken beklenen değeri, bu iyi bilinen bir E [ Y ] , olup, E [ E [ Y | X ] ] = E [ Y ] . Görüyoruz ki E [ A ] = E [ Y - E [ Y X ] ] = E [ Y ] - E [ E [E[YX]E[Y]E[E[YX]]=E[Y] bu aşağıdaki olan Var ( A ) = E [ A 2 ] , olup, var ( Y - E [ Y | X ] ) = E [ ( E - E [ Y | X ] ) 2 ] . Let ifade rastgele değişken ( E - E [ Y

E[A]=E[YE[YX]]=E[Y]E[E[YX]]=0,
var(A)=E[A2]
(4)var(YE[YX])=E[(YE[YX])2].
C böylece var ( Y - E [ Y X ] ) = E [ C ] yazabiliriz . Ancak, E [ C ] = E [ E [ C X ] ] burada E [ C X ] = E [ ( Y - E [ Y X ] )(YE[YX])2
(5)var(Y-E[Y|X])=E[C].
E[C]=E[E[C|X]] Şimdi,belirliolduğu X = X , koşullu dağılımı Y ortalama sahip E [ Y | X = X ] ve böylece E [ ( E - E [ Y | X = X ] ) 2 | X = x ] = var ( Y X = x ) . Başka bir deyişle, EE[C|X]=E[(Y-E[Y|X])2|X].X=xYE[Y|X=x]
E[(Y-E[Y|X=x])2|X=x]=var(Y|X=x).
ve böylecerastgele değişken E [ | X ] sadece olan var ( Y | X ) . Bu nedenle, E [ C ] = E [ E [ C X ] ] = E [ var ( Y X ) ] ,E[C|X=x]=var(Y|X=x) E[C|X]var(Y|X)
(6)E[C]=E[E[C|X]]=E[var(Y|X)],
içine substitusyonuna gösterir bu var ( Y - E [ Y | X ] ) = E [ var ( Y | X ) ] . Bu, ( 2 ) ' nin sağ tarafını tam olarak ihtiyacımız olan şey yapar ve bu nedenle toplam varyans formülünü ( 3 ) kanıtladık .(5)
var(Y-E[Y|X])=E[var(Y|X)].
(2)(3)

Y-E(Y|X)vbirr(Y-E(Y|X))=E[Y-E(Y|X)]2Evbirr(Y|X)=E[E((Y-E(Y|X))2|X)]=E[Y-E(Y|X)]2

1
@mpiktas Teşekkürler. İstenen sonuca ulaşmanın daha kısa yolunun farkındayım, ancak bunu başlangıç ​​öğrencilerinin kolayca takip edebileceği şekilde açıklamakta her zaman zorlanıyorum. Bu arada, yazdığınız son denklemde, sağdaki miktarın yanlış yerleştirilmiş bir üssü vardır: köşeli parantez içindeki miktar karedir; yani olmalıE[(Y-E[Y|X])2]. Bir moderatör mecbur kalmadıkça düzeltmek için çok geç.
Dilip Sarwate

1
Dilip, birçok olasılıkçı @ mpiktas denklemini yazılı olarak doğru yorumlayacaktı; ekstra parantez seti genellikle bırakılır. Belki de gözlerim beni aldatıyor, ama sanırım gösterimi tutarlı. Yine de, istenirse işleri düzeltmekten memnuniyet duyuyorum. :-)
kardinal

@cardinal mpiktas'ın yazısını yanlış yorumlamadım ve ne dediğini tam olarak anlayamadım. Ben de tercümeye alışkınkenEX veya EX beklenen değer olarak X, Her zaman şüphelerim var EX2özellikle de PEMDAŞ bunun hakkında hiçbir şey söylemediğinden. Beklentinin üsse göre önceliği var mı, değil mi? Sanırım sadece köşeli parantez içindeki her şeye uygulamak için beklenti operatörüne alışkınım. Lütfen m [iktas adlı kullanıcının yorumunu düzenlemeyin, ancak bu konudaki her şeyi bir önceki yorumumdaki "Bu arada" tarihinden itibaren silmek istiyorsanız , lütfen devam edin.
Dilip Sarwate

Üzgünüm @ Dalmaç. Niyetim anlamadığınızı öne sürmek değildi; Sahip olduğunuzu biliyordum! Ayrıca gösterimin belirsizliğe de yol açabileceğini kabul ediyorum ve ortaya çıktıklarında bunları belirtmek iyi olur! Demek istediğim, yorumdaki ikinci denklemi düşündüm (yani,vbirr...) bundan sonra kullanılan sözleşmeyi açıklığa kavuşturmuştur. :-)
kardinal

2

Beyan:

Pisagor teoremi, herhangi bir unsur için diyor T1 ve T2 sonlu normlara sahip bir iç ürün boşluğunun T1,T2=0,

(1)||T1+T2||2=||T1||2+||T2||2.
Veya başka bir deyişle, dik vektörler için, toplamın kare uzunluğu kare uzunlukların toplamıdır.

Bizim durumumuz:

Bizim durumumuzda T1=E(Y|X) ve T2=Y-E[Y|X] rastgele değişkenler, kare norm ||Tben||2=E[Tben2] ve iç ürün T1,T2=E[T1T2]. Çevriliyor (1) istatistiksel dile dönüştürmek için:

(2)E[Y2]=E[{E(Y|X)}2]+E[(Y-E[Y|X])2],
Çünkü E[T1T2]=Cov(T1,T2)=0. Bunu değiştirirsek, bunu belirtilen Toplam Varyans Yasası'na benzetebiliriz(2) tarafından...
  1. çıkarmak (E[Y])2 her iki taraftan, sol tarafı yapmak var[Y],

  2. Sağ tarafta dikkat çeken E[{E(Y|X)}2]-(E[Y])2=var(E[Y|X]),

  3. Bunu not et E[(Y-E[Y|X])2]=E[E{(Y-E[Y|X])2}|X]=E[var(Y|X)].

Bu üç madde işareti hakkında ayrıntılar için @ DilipSarwate'in gönderisine bakın. Bütün bunları benden daha detaylı açıklıyor.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.