Bağımlı değişkenlerin ürün varyansı


31

Bağımlı değişkenlerin ürün varyansı için formül nedir?

Bağımsız değişkenler durumunda, formül basittir:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2
Fakat ilişkili değişkenler için formül nedir?

Bu arada, istatistiksel verilere dayanarak korelasyonu nasıl bulabilirim?

Yanıtlar:


32

Dediğin tanıdık kimliği kullanarak,

var(XY)=E(X2Y2)E(XY)2

Kovaryans için benzer formülü kullanmak,

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

ve

E(XY)2=[cov(X,Y)+E(X)E(Y)]2

bu, genel olarak, var(XY) şu şekilde yazılabileceğini belirtir .

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

Bağımsızlık durumunda, cov(X2,Y2)=cov(X,Y)=0 olduğuna ve

[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2

ve iki [E(X)E(Y)]2 terimi iptal edilir ve

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

yukarıda işaret ettiğin gibi.

Düzenleme: Gözlemlediğiniz tek şey ve ve ayrı ayrı değilse , o zaman veya özel durumlar haricinde (örneğin, bir priori olarak bilinen araçlara sahipse )X Y c o v ( X , Y ) c o v ( X 2 , Y 2 ) X , YXYXYcov(X,Y)cov(X2,Y2)X,Y


2
neden E (X2) E (Y2) yerine [var (X) + E (X) 2] ⋅ [var (Y) + E (Y) 2] koyuyorsunuz ???

1
@ user35458, bu nedenle denklemine var (X) ve var (Y) ifadesi olarak verebilir, böylece OP'nin ifadesiyle karşılaştırılabilir. E (X ^ 2) = Var (X) + E (X) ^ 2 olduğuna dikkat edin.
Waldir Leoncio

2
Bu cevabın geçerliliğine dair şimdi silinen bir zorluğa cevap vermek için (çevrimdışı), sonuçlarını birçok simülasyonda ürünün varyansının doğrudan hesaplanmasıyla karşılaştırdım. Bundan kaçınmanız durumunda kullanmanız pratik bir formül değildir, çünkü büyük bir terimi diğerinden çıkarırken iptal etme yoluyla önemli hassasiyetini kaybedebilir - ama mesele bu değil. Dikkat edilmesi gereken bir sorun, bu sorunun rastgele değişkenlerle ilgili olmasıdır. Elde ettiği sonuçlar , yerine paydalarını kullanarakn - 1nn1 (yazılım için olağan olduğu gibi) varyans ve kovaryans hesaplamanız şartıyla verilir .
whuber

14

This is an Zeyilname için @ Makro rasgele değişkenleri korelasyon iki ürünün değişimini belirlemek amacıyla bilinen ihtiyacı tam olarak ne ortaya koyan çok güzel bir cevap. beri burada , , , ve CoV(X,Y)e[X]E[Y]E[X2]E

(1)var(XY)=E[(XY)2](E[XY])2=E[(XY)2](cov(X,Y)+E[X]E[Y])2(2)=E[X2Y2](cov(X,Y)+E[X]E[Y])2(3)=(cov(X2,Y2)+E[X2]E[Y2])(cov(X,Y)+E[X]E[Y])2
cov(X,Y)E[X]E[Y]E[X2]D [ X- 2 , Y 2 ] ( 2 ) CoV ( x 2 , Y, 2 ) ( 3 ) X, Y, CoV ( X , Y ) = CoV ( x 2 , Y, 2 ) = 0 CoV ( X , Y ) 0 E [ X 2 Y 2 ] cov (E[Y2] bilinen miktarlar olduğu varsayılabilir , deki değerini veya içinde belirleyebilmemiz gerekir. . Bu ise, daha önce de belirtildiği gibi, genel olarak yapmak kolay değildir, ancak ve olan bağımsız rastgele değişken, daha sonra . Aslında, bağımlılık, korelasyon değil (ya da bunların eksikliği) kilit konudur. nun sıfır olmayan bir değer yerine eşit olduğunu bildiğimizi biliyoruz ,E[X2Y2](2)cov(X2,Y2)(3)XYcov(X,Y)=cov(X2,Y2)=0cov(X,Y)0çalışmalarımızda en değerini belirlerken yardım veya o halde etmez sağ tarafını basitleştirmek ve biraz.E[X2Y2]( 2 ) ( 3 )cov(X2,Y2)(2)(3)

Zaman ve olan bağımlı sonra (oldukça yaygın veya oldukça önemli) özel bir durum, en az bir rastgele değişkenler, bu bir değerini bulmak mümkün nispeten kolay.Y E [ X 2 Y 2 ]XYE[X2Y2]

Varsayalım ki ve vardır ortaklaşa Normal korelasyon katsayısı ile rastgele değişkenler . Daha sonra, şartlandırılmış ile , koşullu yoğunluğu ortalama ile normal bir yoğunluğa ve varyans . Böylece, Y ρ X = x Y E [ Y ] + ρ XYρX=xYvar(Y)(1-ρ2)E[X2Y2X]E[Y]+ρvar(Y)var(X)(xE[X])var(Y)(1ρ2)Xg(X

E[X2Y2X]=X2E[Y2X]=X2[var(Y)(1ρ2)+(E[Y]+ρvar(Y)var(X)(XE[X]))2]
ki bu, kartik bir işlevidir, diyelim ve Yinelenen Beklenti Kanunu bize ün sağ tarafı ve 3 üncü anların bilgisinden elde edilebilir - birçok metin ve referans kitapta bulunabilen standart sonuçlar (yani Onları aramak ve bu cevaba dahil etmek için çok tembel olduğumu).XE [ X 2 Y 2 ] = E [ E [ X 2 Y 2X ] ] = E [ g ( X ) ] ( 4 ) Xg(X)
(4)E[X2Y2]=E[E[X2Y2X]]=E[g(X)]
(4)X

Daha fazla ek: şimdi silinmiş bir yanıt olarak, @Hydrologist varyansını verir olarak ve bu formülün olduğunu iddia ediyor JASA’da yarım yüzyıl önce yayınlanan iki makaleden. Bu formül, Hidrolog tarafından belirtilen kâğıt (lar) da sonuçların yanlış bir transkripsiyonudur. Özellikle,XY 2(y-E[y])2]Cov[x2,y]Cov[x,y2

(5)Var[xy]=(E[x])2Var[y]+(E[y])2Var[x]+2E[x]Cov[x,y2]+2E[y]Cov[x2,y]+2E[x]E[y]Cov[x,y]+Cov[x2,y2](Cov[x,y])2
Cov[x2,y2]dergi makalesinde 'nin yanlış çevirisi ve benzer şekilde ve .E[(xE[x])2(yE[y])2]Cov[x2,y]Cov[x,y2]

Hesaplanması için eklem, normal durumda, ayrıca bkz math.stackexchange.com/questions/668641/...E(X2Y2)
Samuel Reid
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.