Sınırlı rasgele değişkenin varyansı


22

Rasgele bir değişkenin daha düşük ve daha üst sınıra sahip olduğunu varsayalım [0,1]. Böyle bir değişkenin varyansı nasıl hesaplanır?


8
Sınırsız bir değişken - ayar entegrasyonu veya toplama limitleri için de aynı şekilde.
Scortchi - Monica'yı yeniden yerleştir

2
@Scortchi'nin dediği gibi. Ama neden farklı olabileceğini düşündüğünü merak ediyorum?
Peter Flom - Monica'yı yeniden yerleştir

3
Değişken hakkında bir şey bilmiyorsanız (bu durumda, varyans üzerindeki bir üst sınır sınırların varlığından hesaplanabilir), neden sınırlanmış olduğu gerçeği hesaplamada ortaya çıksın?
Glen_b

6
Yararlı bir üst değerler alır rastgele değişkenin varyans bağlanan olasılığı ile olduğu ve değerler alan bir ayrık rastgele değişken ile elde edilir ve , eşit olasılıkla . Akılda tutulması gereken bir başka nokta varyansın var olacağının garantili olmasıdır; buna karşın sınırlandırılmamış rastgele bir değişkenin varyansı olmayabilir (bazıları, Cauchy rasgele değişkenleri gibi bir anlamı bile yoktur). [a,b]1(ba)2/4ab12
Dilip Sarwate

7
Orada ise olan varyans eşit bir ayrık rasgele değişken : tam değerler alır rastgele değişken ve , eşit olasılıkla . Dolayısıyla, en azından varyans üzerindeki evrensel bir üst sınırın den daha küçük olamayacağını biliyoruz . (ba)24 ab12(ba)24
Dilip Sarwate 21.03.2013

Yanıtlar:


46

Popoviciu'nun eşitsizliğini aşağıdaki gibi ispatlayabilirsiniz. gösterimini ve gösterimini kullanın . Bir fonksiyon tanımlama ile Türev Bilgisayar ve çözme o bulmak onun en az elde ( ) olduğuna dikkat edin .m=infXM=supXg

g(t)=E[(Xt)2].
g
g(t)=2E[X]+2t=0,
gt=E[X]g>0

Şimdi, fonksiyonunun değerini özel noktasından düşünün . Bu durumda olmalıdır Fakat Yana ve , elimizdeki ima bu gt=M+m2

Var[X]=g(E[X])g(M+m2).
g(M+m2)=E[(XM+m2)2]=14E[((Xm)+(XM))2].
Xm0XM0
((Xm)+(XM))2((Xm)(XM))2=(Mm)2,
14E[((Xm)+(XM))2]14E[((Xm)(XM))2]=(Mm)24.
V a r [ X ] ( M - m ) 2 Bu nedenle, Popoviciu'nun eşitsizliğini ispatladık
Var[X](Mm)24.


3
Güzel yaklaşım: bu tür şeylerin titiz gösterilerini görmek güzel.
whuber

22
+1 Güzel! Bilgisayarlar modaya girmeden çok önce istatistikler öğrenmiştim ve bize açılan bir fikir , herhangi bir uygun nokta sapmaların karelerinin toplamını bularak varyans hesaplanması için izin önyargı ayarlama ve daha sonra. Elbette, bu kimlik, nin türevlere gerek kalmadan minimum değere sahip olduğu sonucunun basit bir kanıtını verir . t g ( t
E[(Xt)2]=E[((Xμ)(tμ))2]=E[(Xμ)2]+(tμ)2
tt = μg(t)t=μ
Dilip Sarwate

18

üzerinde bir dağıtım olsun . Biz varyansı eğer gösterecektir maksimal, sonra olabilir hayır o izler hangi iç destek, Bernoulli ve gerisi önemsiz olduğunu.[ 0 , 1 ] F F FF[0,1]FFF

Gösterim ki, let olmak ham andan inci zamanki gibi şunu yazabiliriz (ve, ve varyans için ).k F μ = μ 1 σ 2 = μ 2 - μ 2μk=01xkdF(x)kFμ=μ1σ2=μ2μ2

tüm desteğinin bir noktada olmadığını biliyoruz (varyans bu durumda minimumdur ). Diğer şeylerin yanı sıra, bu ima kesinlikle arasındaki Yalan ve . Çelişki ile tartışmak için, iç kısmında olan ölçülebilir bir alt küme olduğunu varsayalım . Herhangi bir genel bozmadan (değiştirerek varsayabiliriz için olduğu olması) diğer bir deyişle,: bir keserek elde edilen parçası , ortalama ve yukarıdaμ 0 1 I ( 0 , 1 ) F ( I ) > 0 XFμ01I(0,1)F(I)>0XF ( J = I ( 0 , μ ] ) > 0 J I J1XF(J=I(0,μ])>0JIJ Olumlu olasılık var.

Bize değiştirme olsun için dışında tüm olasılık alarak ve en yerleştirerek . F J 0 FFJ0 Bunu yaparken değişir.μk

μk=μkJxkdF(x).

Notasyon olarak, bu tür integraller için[g(x)]=Jg(x)dF(x)

μ2=μ2[x2],μ=μ[x].

Hesaplamak

σ2=μ2μ2=μ2[x2](μ[x])2=σ2+((μ[x][x2])+(μ[x][x]2)).

Sağdaki ikinci terim negatif değildir çünkü her yerinde . Sağdaki ilk terim yeniden yazılabilirμ x J(μ[x][x]2)μxJ

μ[x][x2]=μ(1[1])+([μ][x][x2]).

Sağdaki ilk terim kesinlikle olumludur çünkü (a) ve (b) çünkü bir noktada konsantre olmadığını varsayıyoruz . Bu şekilde yeniden olabilir, çünkü ikinci terim, negatif olmayan bir ve bu integrali varsayımlardan negatif olmayan bir üzerinde ve . izler .[ 1 ] = F ( J ) < 1 F [ ( μ - x ) ( x ) ]μ>0[1]=F(J)<1F[(μx)(x)]J 0 x 1 σ 2 - σ 2 > 0μxJ0x1σ2σ2>0

Az önce varsayımlarımız altında, ye değiştirmenin varyansını kesinlikle arttırdığını gösterdik. Bunun olmasının tek yolu, nin tüm olasılıklarının sırasıyla ve uç noktalarında yoğunlaşmasıdır ( sırasıyla ) ( ) ve sırasıyla değerleri . Varyansı, olduğunda maksimum olan ve orada 4'e eşit olan eşit şekilde kolayca hesaplanır .F F 0 1 1 - pFF F011pp ( 1 - p ) p = 1 / 2 1 / 4pp(1p)p=1/21/4

Şimdi, daki bir dağıtım olduğunda , yeniden alıp üzerindeki bir dağıtıma yeniden ölçeklendiririz . Yeniden başlatma, varyansı değiştirmez, oysa yeniden ölçeklendirme onu böler . Bu nedenle , de maksimum varyansa sahip bir , maksimum varyansa sahip dağılıma karşılık gelir : bu nedenle, varyansa sahip ye dönüştürülen ve ye çevrilen bir Bernoulli dağılımıdır. 2/4 , QED .[ a , b ] [ 0 , 1 ] ( b - a ) 2 K [ a , b ] [ 0 , 1 ] ( 1 / 2 ) [ a , b ] ( b - a ) 2 / 4F[a,b][0,1](ba)2F[a,b][0,1](1/2)[a,b](ba)2/4


İlginç, whuber. Bu kanıtı bilmiyordum.
Zen,

6
@Zen Sizinki kadar zarif değil. Bunu teklif ettim çünkü kendimi yıllar içinde çok daha karmaşık eşitsizliklerle karşı karşıya kaldığımda bu şekilde düşünerek buldum: Eşitsizliği daha da aşırı kılmak için olasılığın nasıl değiştirilebileceğini soruyorum. Sezgisel bir sezgisel buluşsal olarak faydalıdır. Burada ortaya konan yaklaşımları kullanarak, bu tür eşitsizliklerin geniş bir sınıfını ispatlamak için genel bir teorinin, bir Varyasyonlar Analizinin bir çeşit melez tadı ve (sonlu boyutlu) Lagrange çarpan teknikleriyle elde edilebileceğinden şüpheleniyorum.
whuber

Mükemmel: Cevabınız önemlidir, çünkü diğer birçok vakanın üstesinden gelebilecek daha genel bir teknik tarif eder.
Zen,

@ whuber - “Eşitsizliği daha aşırı hale getirmek için olasılığın nasıl değiştirilebileceğini soruyorum.” dedi. - Bu, bu tür sorunlar hakkında düşünmenin doğal bir yolu gibi görünüyor.
Glen_b -Reinstate Monica

Derivasyonda birkaç hata olduğu görülüyor. Bu olmalıdırAyrıca, , eşit değildir, çünkü , aynı değildir[ ( μ - x ) ( x x ] μ [ x ]
μ[x][x2]=μ(1[1])[x]+([μ][x][x2]).
[ μ ] [ x ] - [ x 2 ] [ μ ] [[(μx)(x)][μ][x][x2][μ][x]μ[x]
Leo

13

Eğer rastgele değişken ile sınırlandırılmışsa ve ortalama biliyorsak , varyans ile sınırlandırılmıştır .μ[a,b]( b - μ ) ( μ - a )μ=E[X](bμ)(μa)

İlk önce durumunu ele alalım . tüm için , , bundan sonra da . Bu sonucu kullanarak, a=0,b=1x[0,1]E [ X 2 ] E [ X ] σ 2 = E [ X 2 ] - ( E [ X ] 2x2xE[X2]E[X]

σ2=E[X2](E[X]2)=E[X2]μ2μμ2=μ(1μ).

Aralıklarına genelleme için ile düşünün ile sınırlı . de sınırlanan tanımlayın . Eşdeğer olarak, , ve böylece burada eşitsizlik ilk sonuca dayanır. Şimdi, , sınır ki istenen sonuç.b > a Y [ a , b ] X = Y - a[a,b]b>aY[a,b] [0,1X=Yaba[0,1]V a r [ Y ] = ( b - a ) 2 V a r [ X ] ( b - a ) 2 μ X ( 1Y=(ba)X+aμ X = μ Y - a

Var[Y]=(ba)2Var[X](ba)2μX(1μX).
(b-a)2μX=μYaba
(ba)2μYaba(1μYaba)=(ba)2μYababμYba=(μYa)(bμY),

8

@ User603'ün isteği üzerine ....

Yararlı bir üst varyans bağlı değerleri alır rastgele değişkenin olasılıkla olan . Özel durum için bir kanıt (OP'nin sorduğu şey) burada matematikte bulunabilir . SEE ve kolaylıkla daha genel duruma uyarlanabilir. Ve aynı zamanda yanıt olarak, burada referans olarak yukarıda benim yorum belirtildiği gibi, değerleri alan bir ayrık rastgele değişken ve , eşit olasılıkla sahip varyans ve dolayısıyla daha sıkı bir genel sınır bulunamamıştır. [ a , b ] 1σ2[a,b]1 a=0,b=1σ2(ba)24a=0,b=1ab12(ba)24

Akılda tutulması gereken bir başka nokta, sınırlandırılmış bir rastgele değişkenin sonlu varyansa sahip olmasıdır, oysa sınırlandırılmamış bir rasgele değişken için varyans sonlu olmayabilir ve bazı durumlarda tanımlanamayabilir. Örneğin, ortalama Cauchy rasgele değişkenleri için tanımlanamaz ve bu nedenle kişi varyansı tanımlayamaz (ortalamadan kare sapma beklentisi olarak).


Bu, @ Juho'nun cevabının özel bir hali
Aksakal

Bu sadece bir yorumdu, ancak bu cevabın sorulan soruyu cevaplamadığını da ekleyebilirim.
Aksakal

@Aksakal So ??? Juho biraz farklı ve çok daha yakın zamanda sorulan bir soruya cevap veriyordu . Bu yeni soru, on ay önce yanıtladığım, yukarıda gördüğünüz soruyla birleştirildi.
Dilip Sarwate

0

Bunun genel olarak doğru olduğundan emin misiniz - sürekli ve ayrık dağılımlar için? Diğer sayfalara bir link verebilir misiniz? daki genel bir dağıtım için olduğunu göstermek önemsizdir Keskin eşitsizliklerin var olduğunu hayal edebiliyorum ... Sonuçlarınız için faktöre ihtiyacınız var mı?V a r ( X ) = E [ ( X - E [ X ] ) 2 ] E [ ( b - a ) 2 ] = ( b - a ) 2 . 1 / 4[a,b]

Var(X)=E[(XE[X])2]E[(ba)2]=(ba)2.
1/4

Diğer yandan , popoviciu's_inquality wikipedia'daki adı altında faktörüyle bulabilirsiniz .1/4

Bu makale wikipedia makalesinden daha iyi görünüyor ...

Düzgün bir dağılım için

Var(X)=(ba)212.

Bu sayfa, “Doğrusal Programlamanın Temel Teoreminin” anlaşılmasını gerektirdiği için benim için biraz fazla karışan bir kanıtın başlangıcıyla sonucu ortaya koymaktadır. sci.tech-archive.net/Archive/sci.math/2008-06/msg01239.html
Adam Russell

Buna bir isim verdiğiniz için teşekkür ederiz! "Popoviciu'nun Eşitsizliği" tam da ihtiyacım olan şeydi.
Adam Russell,

2
Bu cevap bazı yanlış önerilerde bulunuyor: gerçekten doğru. Popoviciu eşitsizliği referans çalışacaktır ancak açıkçası onunla dağılımları için geçerlidir sonlu (içerdiğini, özellikle destek yok sürekli dağılımları). Sınırlayıcı bir tartışma hile yapar, ancak burada ekstra bir şeye ihtiyaç var. 1/4
whuber

2
Sürekli bir dağıtım rasgele bir şekilde (cdf cinsinden) rasgele bir şekilde yaklaşabilir (örneğin, belirli bir kütleden merkezlenmiş küçük bir Beta (4, 4) şeklinde çekirdek çekirdeği yerleştirerek - uygun alanın - ve bu tür bir çekirdeğin standart sapmasının, alanını sabit tutarken sıfıra doğru küçülmesine izin verin). Burada tartışıldığı gibi ayrık sınırlar böylece sürekli dağılımlarda sınırlar olarak da hareket edecektir. Gerçekten farklı üst sınırlara sahip sürekli tek modal dağılımları ... düşünmeyi umuyorum .
Glen_b -Reinstate Monica

2
Eh ... cevabım en az yardımcı oldu ama güzel yorumlar nedeniyle burada bırakacaktı. Şerefe, R
Ric
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.