Varyansın ters fonksiyonu


9

Belirli bir sabit sayı için r(örneğin 4), için bir olasılık dağılımı bulmak mümkün mü , böylece ?XVar(X)=r


1
Ekstra bilginiz yoksa hayır.
Hemant Rupani

@Hemant Rupani hangi ek bilgilere ihtiyaç duyulur?
amiref

1
Herhangi bir Rastgele Değişken 'X'
doğası

3
Sorunuzu, "X için" değerini "X için dağıtım" ile değiştirmek için düzenlemenizi öneririz - X'in tek bir değeri varsa, X'in dejenere dağılımı vardır ve varyans sıfır olur.
Silverfish

1
olmadıkça rolumsuz cevap açıktır evet, bir varyans herhangi bir pozitif sayı olabilir.
dsaxton

Yanıtlar:


13

Davaları dikkatlice değerlendirmek r: Eğer r=0 o zaman dağıtım dejenere olur, ama X herhangi bir anlamı olabilir. Yani,Pr(X=μ)=1 ve Pr(X=c)=0 herhangi cμ. Böylece birçok olası dağıtım bulabiliriz.X, ancak bunlar tarafından dizine eklenir ve tarafından tamamen belirtilir μR.

Eğer r<0 , dağıtım bulunamadı çünkü Var(X)=E(XμX)20.

İçin r>0, yanıt ne hakkında ek bilgilerin bilindiğine bağlı olacaktır. X. Örneğin,X anlamı olduğu biliniyor μ, sonra herhangi biri için μR ve r>0 alarak bu anlarla bir dağılım bulabiliriz XN(μ,r). Bu, ortalama ve varyansın eşleştirilmesi sorununa benzersiz bir çözüm değildir, ancak normal olarak dağıtılan tek çözümdür (ve olası tüm çözümlerden, Daniel'in belirttiği gibi entropiyi en üst düzeye çıkaran çözüm budur). Ayrıca üçüncü merkezi anı veya daha yüksek bir anı eşleştirmek istediyseniz , daha geniş bir olasılık dağılımlarını dikkate almanız gerekir.

Bunun yerine, dağıtımı hakkında bazı bilgilerimiz olduğunu varsayalım. Xanlarından ziyade. Örneğin, eğerX bir Poisson dağılımını takip eder, o zaman benzersiz çözüm XPoisson(r). Eğer bilersekX üstel bir dağılımı takip eder, o zaman yine benzersiz bir çözüm var XExponential(1r), burada parametreyi çözerek bulduk Var(X)=r=1λ2.

Diğer durumlarda bütün bir çözüm ailesi bulabiliriz. Eğer bilersekX dikdörtgen (sürekli üniforma) dağılımını takip eder, o zaman benzersiz bir genişlik bulabiliriz w çözerek dağıtım için Var(X)=r=w212. Ama bütün bir çözüm ailesi olacak,XU(a,a+w) tarafından parametrelendirildi aR- bu setteki dağılımların hepsi birbirinin çevirisidir. Benzer şekilde,X herhangi bir dağılımdan normal XN(μ,r) işe yarayacaktır (dolayısıyla, dizine eklenmiş bir dizi çözümümüz var μ, bu da yine herhangi bir gerçek sayı olabilir ve yine ailenin hepsi birbirinin çevirisidir). EğerXbir gamma dağılımını takip eder , daha sonra şekil ölçeğinde parametreleştirmeyi kullanarak bütün bir çözüm ailesi elde edebiliriz,XGamma(rθ2,θ) tarafından parametrelendirildi θ>0. Bu ailenin üyeleri birbirinin çevirisi değildir. Bir "çözüm ailesi" nin nasıl görünebileceğini görselleştirmeye yardımcı olmak için, aşağıdakiler tarafından dizine eklenmiş normal dağıtım örnekleriμve ardından tarafından endekslenen gama dağılımları θ, hepsi dörte eşit varyansa sahip, örneğe karşılık r=4 sorunuzda.

Dört varyanslı normal dağılımlar Dört varyanslı gama dağılımları

Öte yandan, bazı dağıtımlar için, değerine bağlı olarak bir çözüm bulmak mümkün olabilir veya olmayabilir. r. Örneğin,X o zaman bir Bernoulli değişkeni olmalı 0r<0.25 iki olası çözüm var XBernoulli(p) çünkü iki olasılık var p denklemi çözen Var(X)=r=p(1p)ve aslında bu iki olasılık tamamlayıcıdır yani p1+p2=1. İçinr=0.25 sadece eşsiz bir çözüm var p=0.5, ve için r>0.25 hiçbir Bernoulli dağılımı yeterince yüksek varyansa sahip değildir.

Davadan da bahsetmem gerektiğini hissediyorum r=. Bu durum için de çözümler var, örneğin bir Öğrencitiki serbestlik dereceli dağılım .

Grafikler için R kodu

require(ggplot2)

x.df  <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
    mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")

x.df  <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
    theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
    coord_cartesian(ylim = c(0, 1)) 

17

Eğer bu mümkün" demek varsayarak bir bulmak için olasılık dağılımını içinX"o zaman cevap evettir, çünkü Xtatmin etmek gerekir. Aslında, bu koşulu karşılayacak sonsuz sayıda olası dağıtım vardır. Normal bir dağılım düşünün,N(x;μ,σ2). Ayarlayabilirsinizσ2=r ve μ İstediğiniz herhangi bir değeri alabilir - Var[X]=r gereğince, gerektiği gibi.

Aslında, Normal dağılım bu bakımdan oldukça özeldir çünkü belirli bir ortalama ve varyans için maksimum entropi olasılık dağılımıdır .


haklısın, düzelttim. lütfen daha fazla açıklar mısınız?
amiref

@AmirEf Net olmayan nedir?
Daniel

6
Daniel'in başka neleri açıklaması gerektiği belli değil; Buradaki yanıt, yayınlanan sorunuzdaki her şeyle ilgileniyor gibi görünüyor.
Glen_b -Mons Monica

15

Bu soru onu ilginç ve tamamen önemsiz olmayan bir şekilde yorumlayabilir. Bir şey verdimXO bakışlar onun varyans bazı önceden belirlenmiş sayısına eşittir o şekilde (etrafında veya vardiya mevcut olasılıklar) kendi değerlerine atama olasılıklar mümkündür ne derece rastgele değişkenin gibir? Cevap, tüm olası değerlerinr0 aralığına göre belirlenen bir sınıra kadar izin verilebilir X.

Böyle bir analize potansiyel ilgi, belirli bir sonuca ulaşmak için rastgele bir değişkeni sabit tutarken bir olasılık ölçüsünü değiştirme fikrinde yatmaktadır. Bu uygulama basit olmasına rağmen , matematik finansında temel bir sonuç olan Girsanov teoreminin altında yatan bazı fikirleri görüntüler .


Bu soruyu titiz, açık bir şekilde ele alalım. varsaymak

X:(Ω,S)R

bir ölçü alanında tanımlanan ölçülebilir bir işlevdir Ω sigma-cebiri ile S. Belirli bir gerçek sayı içinr>0, ne zaman bir olasılık ölçüsü bulmak mümkün P bu alanda Var(X)=r?

Cevap şu ki bu mümkün olduğundasup(X)inf(X)>2r. (Eşitlik, hem supremum hem de infimum'a ulaşılırsa geçerli olabilir: yani, aslında maksimum ve minimumX.) İkisinden biri sup(X)= veya inf(X)=, bu durum, rve ardından varyansın negatif olmayan tüm değerleri mümkündür.

Kanıt yapım gereğidir. Ayrıntılara dikkat etmek ve temel fikri tespit etmek ve daha sonra gerçek yapıya geçmek için basit bir sürümü ile başlayalım.

  1. İzin Vermek x suretinde olmak X: bu bir ωxΩ hangisi için X(ωx)=x. Set fonksiyonunu tanımlamaP:S[0,1] göstergesi olmak ωx: yani, P(A)=0 Eğer ωxA ve P(A)=1 ne zaman ωxA.

    Dan beri P(Ω)=1, açıkçası Pilk iki olasılık aksiyomunu karşılar . Üçüncüyü tatmin ettiğini göstermek gerekir; yani sigma katkısıdır. Ancak bu neredeyse açıktır: ne zaman{Ei,i=1,2,} sonlu veya sayıca sınırsız olarak birbirini dışlayan olaylar dizisidir. ωx--bu durumda P(Ei)=0 hepsi için i--veya tam olarak bunlardan biri ωx, bu durumda P(Ej)=1 özellikle j ve aksi halde P(Ei)=0 hepsi için ij. Her iki durumda da

    P(iEi)=iP(Ei)

    çünkü her iki taraf da her ikisi de 0 ya da her ikisi de 1.

    Dan beri P tüm olasılığı ωx, dağılımı X konsantre x ve X sıfır varyansa sahip olmalıdır.

  2. İzin Vermek x1x2 aralığında iki değer olmak X; yani,X(ω1)=x1 ve X(ω2)=x2. Önceki adıma benzer bir şekilde, bir hesaplama tanımlayınP göstergelerinin ağırlıklı ortalaması olmak ω1 ve ω2. Use non-negative weights 1p and p for p to be determined. Just as before, we find that P--being a convex combination of the indicator measures discussed in (1)--is a probability measure. The distribution of X with respect to this measure is a Bernoulli(p) distribution that has been scaled by x2x1 and shifted by x1. Because the variance of a Bernoulli(p) distribution is p(1p), the variance of X must be (x2x1)2p(1p).

An immediate consequence of (2) is that any r for which there exist x1x2 in the range of X and 0p<1 for which

r=(x2x1)2p(1p)

can be the variance of X. Since 0p(1p)1/4, this implies

2r=4rrp(1p)=(x2x1)2=x2x1sup(X)inf(X),

with equality holding if and only if X has a maximum and minimum.

Conversely, if r exceeds this bound of (sup(X)inf(X))2/4, then no solution is possible, since we already know that the variance of any bounded random variable cannot exceed one-quarter the square of its range.


3
Dude, I think you're at a whole different level than the OP.
Mark L. Stone

4
@Mark Probably. (I think you detected a whiff of very dry humor here.) But anyone applying the mathematical-statistics tag to their post ought to expect this kind of stuff :-).
whuber

2
It kind of reminds me of when I took a 4 student class from the late Prof Samuel Karlin (of Karlin and Taylor fame among others things) on "Total Positivity". The topic of game theory somehow came up. He said, oh, game theory. You have two non-negative sigma-finite measures ...., Now imagine him introducing game theory this way to students in a freshman economics class at a liberal arts college. That's what your post made me think of.
Mark L. Stone

@Mark Understood. One would not do that and succeed. As you point out, I am writing here for (a subset of) general readers rather than a specific one. On the other hand, the abstract subject is not difficult (at this elementary level) and has proven to be accessible to motivated underclassmen at liberal arts colleges. See the comments at stats.stackexchange.com/a/94876 for instance.
whuber

4
@MarkL.Stone Answers are for more than just the immediate asker (SE is intended to be a repository of good questions and good answers valuable to later people with similar questions), and we have answers for the more elementary view of the question here already. Some other readers may get something out of the less elementary take on things, so a variety of styles and levels of answer makes the question useful to more people.
Glen_b -Reinstate Monica

10

Yes, it's possible to find such distribution. In fact you can take any distribution with a finite variance, and scale to match your condition, because

Var[cX]=c2Var[X]

For instance, a uniform distribution on interval [0,1] has variance:

σ2=112
Hence, a uniform distribution in the interval [0,112r] will have variance r.

In fact, this is a common way to add parameters to some distributions, such as Student t. It has only one parameter, ν - degrees of freedom. When ν the distribution converges to a standard normal. It is bell shaped, and looks a lot like normal, but has fatter tails. That's why it's often used as an alternative to a normal distribution when the tails are fat. The only problem is that Gaussian distribution has two parameters. So, comes the scaled version of Student t, which is sometimes called "t location scale" distribution. This a very simple transformation: ξ=tμs, where μ,s are location and scale. Now, you can set the scale so that the new variable ξ will have any required variance, and will have a shape of Student t distribution.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.