E[Y∣X] ve Y−E[Y∣X] ' un ilişkisiz rasgele değişkenler olduğu için dik açılı üçgeni dikkate alma konusunda rahat olduğunuzu varsayıyorum . İlintisiz rastgele değişkenler için A ve B ,
var(A+B)=var(A)+var(B),(1)
biz ayarlanır ve bu durumda
A=Y−E[Y∣X] ve
B=E[Y∣X] böylece
A+B=Y ,
var( Y) = var( Y- E[ Y∣ X] ) + var( E[ Y∣ X] ) .(2)
O göstermek kalıyor
İle aynıdır
E [ var ( Y | X ) ] bu yüzden ki yeniden belirlemek
( 2 ) olarak
var ( Y ) = E [ var ( Y | X ) ] + var ( E [ Y | X ] )
toplam varyans formülüdür.
var( Y- E[ Y∣ X] )E[ var( Y∣ X) ](2)var(Y)=E[var(Y∣X)]+var(E[Y∣X])(3)
Bu rastgele değişken beklenen değeri, bu iyi bilinen bir E [ Y ] , olup, E [ E [ Y | X ] ] = E [ Y ] . Görüyoruz ki
E [ A ] = E [ Y - E [ Y ∣ X ] ] = E [ Y ] - E [ E [E[Y∣X]E[Y]E[E[Y∣X]]=E[Y]
bu aşağıdaki olan Var ( A ) = E [ A 2 ] , olup,
var ( Y - E [ Y | X ] ) = E [ ( E - E [ Y | X ] ) 2 ] .
Let Cı ifade rastgele değişken ( E - E [ Y
E[A]=E[Y−E[Y∣X]]=E[Y]−E[E[Y∣X]]=0,
var(A)=E[A2]var(Y−E[Y∣X])=E[(Y−E[Y∣X])2].(4)
C böylece
var ( Y - E [ Y ∣ X ] ) = E [ C ] yazabiliriz
.
Ancak,
E [ C ] = E [ E [ C ∣ X ] ] burada
E [ C ∣ X ] = E [ ( Y - E [ Y ∣ X ] )(Y−E[Y∣X])2var(Y−E[Y∣X])=E[ C] .(5)
E[ C] = E[ E[ C∣ X] ]
Şimdi,
belirliolduğu
X = X , koşullu dağılımı
Y ortalama sahip
E [ Y | X = X ]
ve böylece
E [ ( E - E [ Y | X = X ] ) 2 | X = x ] = var ( Y ∣ X = x ) .
Başka bir deyişle,
EE[ C∣ X] = E[ (Y- E[ Y∣ X] )2||X] .X= xYE[ Y∣ X= x ]E[ (Y- E[ Y∣ X= x ] )2||X= x ] = var( Y∣ X= x ) .
ve böylece
rastgele değişken E [ Cı | X ] sadece olan
var ( Y | X ) . Bu nedenle,
E [ C ] = E [ E [ C ∣ X ] ] = E [ var ( Y ∣ X ) ] ,E[ C∣ X= x ] = var( Y∣ X= x ) E[ C∣ X]var( Y∣ X)E[ C] = E[ E[ C∣ X] ] = E[ var( Y∣ X) ] ,(6)
içine substitusyonuna
gösterir bu
var ( Y - E [ Y | X ] ) = E [ var ( Y | X ) ] .
Bu,
( 2 ) ' nin sağ tarafını tam olarak ihtiyacımız olan şey yapar ve bu nedenle toplam varyans formülünü
( 3 ) kanıtladık .
( 5 )var( Y- E[ Y∣ X] ) = E[ var( Y∣ X) ] .
( 2 )( 3 )