Tek değişkenli rastgele bir değişkenin ortalaması her zaman onun kuantil fonksiyonunun integraline eşit midir?


17

Sadece tek değişkenli rastgele değişkenin kantil fonksiyonunu (ters cdf) p = 0'dan p = 1'e entegre etmenin değişkenin ortalamasını oluşturduğunu fark ettim. Bu ilişkiyi daha önce duymadım, bu yüzden merak ediyorum: Bu her zaman böyle mi? Eğer öyleyse, bu ilişki yaygın olarak biliniyor mu?

İşte python'da bir örnek:

from math import sqrt
from scipy.integrate import quad
from scipy.special import erfinv

def normalPdf(x, mu, sigma):
    return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0))

def normalQf(p, mu, sigma):
    return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0)

mu = 2.5
sigma = 1.3
quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0]
print quantileIntegral # Prints 2.5.

Yanıtlar:


26

Let F rasgele değişken arasında CDF olmak X CDF ters yazılabilir böylece, F1 . İçin entegre yapmak yerine p=F(x) , dp=F(x)dx=f(x)dx elde etmek için

01F1(p)dp=xf(x)dx=EF[X].

Bu sürekli dağılımlar için geçerlidir. Ters bir CDF'nin benzersiz bir tanımı olmadığından diğer dağıtımlara dikkat edilmelidir.

Düzenle

Değişken sürekli olmadığında, ters CDF'nin tanımında ve hesaplama integrallerinde bakım gerektiren Lebesgue ölçüsüne göre kesinlikle sürekli bir dağılım yoktur. Örneğin, ayrı bir dağılım söz konusu olabilir. Tanım olarak, bu CDF F , olası her bir x değerinde boyutunda adımlara sahip bir adım işlevi olan bir işlevdir .PrF(x)x

Şekil 1

Bu şekil, bir Bernoulli CDF (2/3) dağıtım ile ölçekli 2 . Kendisine, rastgele değişkenin olasılığına sahiptir 1/3 eşit bir 0 ve bir olasılık 2/3 eşit bir 2 . 0 ve sıçramaların yükseklikleri 2olasılıklarını verir. Bu değişkenin beklenti açıkça eşittir 0×(1/3)+2×(2/3)=4/3 .

Biz bir "CDF ters" tanımlayabilir F1 gerektirerek

F1(p)=x if F(x)p and F(x)<p.

Bu, F1 bir adım fonksiyonu olduğu anlamına gelir . Rastgele değişkenin olası herhangi bir değeri xiçin, F1 , Pr F ( x ) uzunluğunda değerini alacaktır . Bu nedenle integrali , sadece beklenti olan x Pr F ( x ) değerlerinin toplanmasıyla elde edilir .xPrF(x)xPrF(x)

şekil 2

Bu, önceki örneğin ters CDF'sinin grafiğidir. Sıçrayışlarını ve 2 / 3 CDF yüksekliklerde bu uzunlukta yatay hatlar eşit hale 0 ve 2 , olan olasılıklar, ilişkili değer. (Ters CDF aralığının ötesine tanımlanmamıştır [ 0 , 1 ] ). Bunun yekpare iki dikdörtgen, boy bir toplamı 0 ve taban 1 / 3 , yükseklik diğer 2 ve taban 2 / 3 olmak üzere toplam 4 / 31/32/302[0,1]01/322/34/3, eskisi gibi.

Genel olarak, sürekli ve ayrık bir dağılımın bir karışımı için, bu yapıya paralel olarak ters CDF'yi tanımlamamız gerekir: yüksekliğinin her ayrık atlamasında , önceki formülde verildiği gibi , p uzunluğunda yatay bir çizgi oluşturmalıyız .pp


Değişken değişiminde bir hata yaptınız. x nereden geliyor?
Mascarpone

3
@Mascarpone Lütfen denklemin önündeki metni okuyun. Değişken :-) değişikliğinde bir hata olduğunu düşünmüyorum, ancak açıklamayı netleştireceğini düşünüyorsanız, olduğunda x = F - 1 ( p ) . Bunun gerekli olduğunu düşünmedim. p=F(x)x=F1(p)
whuber

şimdi anladım;),
Mascarpone

+1 Whuber: Teşekkürler! Verdiğiniz formülü kullanmak için ters CDF'si benzersiz bir tanıma sahip olmayan diğer dağıtımlara nasıl dikkat edersiniz?
Herkes için StackExchange

1
Tersler, sahte tersler ve benzerleri hakkındaki bu tür huzursuz düşünceleri atlamak ve aynı anda her anı genelleştirmek için buraya bakın .

9

Eşdeğer bir sonuç sağkalım analizinde iyi bilinir : beklenen ömür sağkalım fonksiyonunun S ( t ) = Pr ( T > t ) olduğu doğumdan itibaren t = 0'da ölçülür. (Kolayca negatif değerleri kapsayacak şekilde genişletilebilir t ).

t=0S(t)dt
S(t)=Pr(T>t)t=0t

enter image description here

Böylece bunu t = 0 ( 1 - F ( t ) ) olarak yeniden yazabiliriz ama bu1 q = 0 F - 1 ( q )

t=0(1F(t))dt
söz konusu alanın çeşitli yansımalarında gösterildiği gibi
q=01F1(q)dq

enter image description here


1
Fotoğrafları seviyorum ve içgüdüsel olarak burada gizlenen harika bir fikir olduğunu hissediyorum - fikri seviyorum - ama bu özel olanları anlamıyorum. Açıklamalar yardımcı olacaktır. İzlerimde beni durduran bir şey, - - integralini genişletmeye çalışmaktır . (1F(t))dt
whuber

@whuber: Negatif genişletmek istiyorsanız , t = 0 ( 1 -tt=0(1F(t))dtt=0F(t)dt0F(t)=1F(t)t=0(1F(t))dt+t=0F(t)dt gives the average absolute deviation about 0.
Henry

If you like diagrams, you may be interested in this 1988 paper by Lee: The Mathematics of Excess of Loss Coverages and Retrospective Rating-A Graphical Approach.
Avraham

4

We are evaluating:

enter image description here

Let's try with a simple change of variable:

enter image description here

And we notice that, by definition of PDF and CDF:

enter image description here

almost everywhere. Thus we have, by definition of expected value:

enter image description here


In the final line I explain more clearly the definition of expected value. The almost everywhere refers to the equation above the last one. en.wikipedia.org/wiki/Almost_everywhere
Mascarpone

1
edited, thanx :)
Mascarpone

3

For any real-valued random variable X with cdf F it is well-known that F1(U) has the same law than X when U is uniform on (0,1). Therefore the expectation of X, whenever it exists, is the same as the expectation of F1(U):

E(X)=E(F1(U))=01F1(u)du.
The representation XF1(U) holds for a general cdf F, taking F1 to be the left-continuous inverse of F in the case when F it is not invertible.

1

Note that F(x) is defined as P(Xx) and is a right-continuous function. F1 is defined as

F1(p)=min(x|F(x)p).
The min makes sense because of the right continuity. Let U be a uniform distribution on [0,1]. You can easily verify that F1(U) has the same CDF as X, which is F. This doesn't require X to be continuous. Hence, E(X)=E(F1(U))=01F1(p)dp. The integral is the Riemann–Stieltjes integral. The only assumption we need is the mean of X exists (E|X|<).

That's the same answer as mine.
Stéphane Laurent
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.