Varyansın doğrusallığı


16

Aşağıdaki iki formülün doğru olduğunu düşünüyorum:

Var(aX)=a2Var(X)
a sabit bir sayı iken eğer , bağımsız
Var(X+Y)=Var(X)+Var(Y)
XY

Ancak, aşağıdakilerle ilgili sorunun ne olduğundan emin değilim:

Var(2X)=Var(X+X)=Var(X)+Var(X)
, eşit değil , yani .4 V a r ( X )22Var(X)4Var(X)

bir popülasyondan alınan örnek olduğu varsayılırsa, sanırım her zaman diğer bağımsız olduğunu varsayabiliriz .X XXXX

Peki karışıklığımdaki sorun ne?


8
Varyans doğrusal değildir - ilk bunu gösterir (eğer olsaydı, olurdu . Öte yandan kovaryans bilineardir.Var(aX)=aVar(X)
Batman

Yanıtlar:


33

Akıl yürütme hattınızdaki sorun

"Sanırım her zaman diğer bağımsız olduğunu varsayabiliriz ."XXX

bağımsız değildir. sembolü, burada aynı rastgele değişkeni belirtmek için kullanılmaktadır. Formülünüzde görünenilkdeğerini öğrendikten sonra, ikincideğerini görünecek şekildede düzeltir. Farklı (ve potansiyel olarak bağımsız) rastgele değişkenlere başvurmalarını istiyorsanız, bunları farklı harflerle (örn.ve) veya abonelikleri (örn.ve)kullanarakbelirtmeniz gerekir; ikincisi genellikle (her zaman değil) aynı dağıtımdan çizilen değişkenleri göstermek için kullanılır.XX X X X Y X 1 X 2XXXXXYX1X2

İki ve değişkeni bağımsızsa, aynıdır : değerini bilmek bize değeri hakkında ek bilgi vermez . Ama ise ise ve değerini bilerek: Aksi size değeri hakkında tam bilgi verir . [Bu paragraftaki olasılıkları, esasen aynı etkiyi göstermek için kümülatif dağılım işlevleriyle veya uygun olduğunda olasılık yoğunluk işlevleriyle değiştirebilirsiniz.]Y Pr ( X = a | Y = b ) Pr ( X = a ) Y X Pr ( X = a | X = b ) 1 a = b 0 X XXYPr(X=a|Y=b)Pr(X=a)YXPr(X=a|X=b)1a=b0XX

Şeyler görmeye bir başka yolu olduğunu iki değişken bağımsız ise o zaman sıfır korelasyona sahip (gerçi sıfır korelasyon bağımsızlığını anlamına gelmez !) Ama olduğu mükemmel kendisiyle ilişkili, nedenle olamaz kendinden bağımsız. Not bu yana kovaryans ile verilir , daha sonraCorr ( X , X ) = 1 X Cov ( X , Y ) = Corr ( X , Y ) XCorr(X,X)=1X Cov(X,X)=1Cov(X,Y)=Corr(X,Y)Var(X)Var(Y)

Cov(X,X)=1Var(X)2=Var(X)

İki rastgele değişkenin toplamının varyansı için daha genel formül

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

Özellikle, ,Cov(X,X)=Var(X)

Var(X+X)=Var(X)+Var(X)+2Var(X)=4Var(X)

ki bu kuralın uygulanmasından çıkartılacaklarınızla aynıdır

Var(aX)=a2Var(X)Var(2X)=4Var(X)

Doğrusallıkla ilgileniyorsanız , kovaryansın bilinearitesi ile ilgilenebilirsiniz . Rasgele değişkenler için , , ve (bağımlı veya bağımsız olsun) ve sabitler , , ve ElimizdekiX Y Z a b c dWXYZabcd

Cov(aW+bX,Y)=aCov(W,Y)+bCov(X,Y)

Cov(X,cY+dZ)=cCov(X,Y)+dCov(X,Z)

ve genel olarak,

Cov(aW+bX,cY+dZ)=acCov(W,Y)+adCov(W,Z)+bcCov(X,Y)+bdCov(X,Z)

Daha sonra bunu, yayınınıza yazdığınız varyansın (doğrusal olmayan) sonuçlarını kanıtlamak için kullanabilirsiniz:

Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)

Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y)

İkincisi, olduğunda özel bir durum olarak ,a=b=1

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

Zaman ve (bunlar bağımsız olduğu durumu da içeren) ilintisizdir, bu azaltır . Bu nedenle, varyansları "doğrusal" bir şekilde değiştirmek istiyorsanız (bu genellikle cebirsel olarak çalışmanın güzel bir yoludur), bunun yerine kovaryanslarla çalışın ve bilinirliklerinden yararlanın.XYVar(X+Y)=Var(X)+Var(Y)


1
Evet! Sanırım başlangıçta kafa karışıklığının aslında notasyonel olduğunu belirttiniz. Bir kitap (çok açık bir şekilde, bazıları zahmetli bir şekilde söyleyebilir) olasılıklı bir ifadenin yorumlanmasını ve değerlendirme kurallarını açıkladığında çok yararlı buldum (böylece, örneğin, ne demek istediğinizi biliyor olsanız bile) burada , bu teknik olarak yanlış bir atma düşünüyoruz eğer (ve barbut içinde olayı olur;) tek bir silindir elde asla iid kullanılarak düzgün ifade edildi). Pr(X+X=n)XUniform(1..6)nX+X=2XX1,X2
Vandermonde

1
Bu durumun tam tersidir (ve benim yanlış anlama kaynaklanmış olabileceğini düşünmek) ne 2+PRNG(6)+PRNG(6)sıklıkta olduğunu sen / gibi kongre üstünde ve / veya gösterim olarak zar atmak nasıl farklı örneklerin gerçekten bağımsız olması amaçlanan . 2d6=d6+d6
Vandermonde

@Vandermonde Bu ilginç bir nokta. Başlangıçta "farklı " arasında ayrım yapmak için aboneliklerin kullanılmasından bahsetmeyi düşündüm ama rahatsız etmedim - şimdi düzenleyebileceğimi düşünüyorum. "Toplam 2 X olsaydı hiçbir zaman tek bir toplam puan elde edemezsiniz " iddiası çok açık ve ayırt etme ihtiyacını göremeyen birine ikna ediyor: paylaştığınız için teşekkürler. X2X
Silverfish

0

Düşünmeden bir başka yolu olduğunu rasgele değişkenlerle 2XX+X .

2X ,X sonucunun iki katı anlamınagelirken,X+X ikiX denemesi anlamına gelir. Başka bir deyişle, bir kalıbı bir kez yuvarlamak ve sonucu iki katına çıkarmak ile bir kalıbı iki kez yuvarlamak arasındaki farktır.


+1 Bu çok açık ve doğru bir cevaptır. Sitemize hoşgeldiniz!
whuber

Teşekkürler @whuber!
Benjamin
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.