Radon-Nikodym türevinin olasılık ölçümleri arasında yorumlanması?


11

Bazı noktalarda gördük diğerine göre bir olasılık ölçü Radon Nikodym türevinin kullanımı, özellikle bu keyfi bir parametre için bir model olasılığı ölçü türevidir Kullback-Leibler sapma bölgesi gerçek parametresine :θ 0θθ0

dPθdPθ0

Bunların her ikisi de bir parametre değerine bağlı veri noktaları uzayında olasılık ölçümleri olduğunda: .Pθ(D)=P(D|θ)

Kullback-Leibler sapmasında veya daha genel olarak iki olasılık ölçüsü arasında böyle bir Radon-Nikodym türevinin yorumu nedir?

Yanıtlar:


12

İlk olarak, olasılık önlemlerine ihtiyacımız yok, sadece sonluluk. Yani let M = ( Ω , F ) ölçülebilir bir uzay olmak ve izin μ ve v olmak σ üzerinde -finite önlemler M .σM=(Ω,F)μνσM

Radon Nikodym teoremi eğer belirtmektedir , tüm için bir F ile gösterilen, μ » ν , daha sonra, negatif olmayan bir Borel işlevi vardır f bu şekilde ν ( A ) = bir fμ(A)=0ν(A)=0AFμνf tüm A F için d μ .

ν(A)=Afdμ
AF

İşte böyle düşünmeyi seviyorum. İlk olarak, herhangi iki tedbir , izin en tanımlayan μ ~ ν için ortalama μ ( A ) = 0Mμν . Bu, geçerli bir denklik ilişkisi olduğunu ve söylemek μ ve ν olaneşdeğerbu durumda. Bu neden önlemler için mantıklı bir denkliktir? Ölçümler sadece işlevlerdir, ancak alanlarının görselleştirilmesi zordur. Peki iki sıradan işlev f , g : RR bu özelliğesahipse, yani f ( x ) = 0μ(A)=0ν(A)=0μνf,g:RR ? Peki, h ( x ) = { f ( x ) / g ( x ) g ( x ) 0 π e o.w. ve not destek herhangi bir yerde bu gr Elimizdeki g h = f , ve desteğin dış g g h = 0 tt e = 0 = f (beri ff(x)=0g(x)=0

h(x)={f(x)/g(x)g(x)0πeo.w.
ggh=fg gh=0πe=0=ffve payı destekleri) böylece saat bize rescale sağlayan g içine f . @Whuber'ın belirttiği gibi, buradaki ana fikir, 0 / 0'ın bir şekilde yapmak veya görmezden gelmek için "güvenli" olmadığıdır, aksine g = 0 olduğunda, h'nin ne yaptığı önemli değildir , bu yüzden keyfi olarak tanımlayabiliriz (örneğin olmak π e burada özel bir anlamı yoktur olan) ve şeyleri hala işi. Ayrıca, bu durumda biz benzer fonksiyonu tanımlayabilir h ' ile gr / m olacak şekilde f h ' = g .ghgf0/0g=0hπeh'g/ffh'=g

Sonra diyelim ki , ancak diğer yön zorunlu değildir. Bu, önceki h tanımımızınhala çalıştığıanlamına gelir, ancak şimdi h , 0'a kadar gerçek bölümlere sahipolacağı içinçalışmaz. Böylece rescale edebilir g içine f aracılığıyla gr h = f , ama biz rescale şeye gerek birşey olduğu diğer yöne gidemez 0 şey olmayan sıfır içine.g(x)=0f(x)=0hh'0gfgh=f0

Şimdi ve ν'ya dönelim ve RND'yi f ile gösterelim . Eğer μ ~ ν bir tam tersi diğer içine yeniden ölçeklendirilmiş ve yardımcısı olabilir ki, o zaman bu, sezgisel anlamına gelir. Ancak genellikle bununla sadece bir yöne gitmek istiyoruz (yani Lebesgue ölçüsü gibi güzel bir ölçüyü daha soyut bir ölçüye yeniden ölçeklendirmek), bu yüzden yararlı şeyler yapmak için sadece μ ν'ya ihtiyacımız var. Bu yeniden ölçeklendirme RND'nin kalbidir.μνfμ~νμ»ν

Yorumlarda @ whuber bakış açısından geri dönersek, ekstra bir incelik var neden o sorunu görmezden güvenlidir . Bunun nedeni, ölçümlerde yalnızca 0 ölçüm kümesine kadar olan şeyleri tanımladığımızdan , μ ( A ) = 0 olan herhangi bir A setinde RND'mizin herhangi bir değer almasını sağlayabiliriz, örneğin 1 . Ondan değil Yani 0 / 0 doğrusu her yerde biz olurdu kendinden güvenli ama 0 / 0 tedbir kümesidir 0 wrt u0/00birμ(bir)=010/00/00μ yani RND'mizi hiçbir şeyi etkilemeden güzel bir şey olarak tanımlayabiliriz.

Örnek olarak, bazı k > 0 için diyelim . Sonra ν ( A ) = Akμ=νk>0 yani f ( x ) = k = d ν

ν(bir)=birdν=birkdμ
, RND'dir (bu, ölçümler teoreminin değişimi ile daha resmi olarak haklı gösterilebilir). Bu iyidir çünkü ölçeklendirme faktörünü tam olarak iyileştirdik.f(x)=k=dνdμ

Aşağıda, ölçüm kümelerindeki RND'lerin değiştirilmesinin onları nasıl etkilemediğini vurgulayan ikinci bir örnek verilmiştir . Let f ( x ) = φ ( x ) + 1 S ( x ) , standart normal bir PDF artı yani 1 giriş rasyonel ve eğer izin X, bu yoğunluğa sahip bir rv olabilir. Bu P ( X A ) = A ( φ + 1 Q ) anlamına gelir0f(x)=φ(x)+1S(x)1X= A φ

P(Xbir)=bir(φ+1S)dλ
yani aslında X hala standart bir Gauss RV'dir. Q üzerinde X'i değiştirmek için herhangi bir şekilde dağılımı etkilememiştir,çünkü 0 wrt λ ölçüsü kümesidir.
=birφdλ+λ(S)=birφdλ
XXS0λ

Son bir örnek olarak, ve Y Bin ( n , p ) diyelim ve P X ve P Y'nin ilgili dağılımları olmasına izin verin . Geri çağırma PMF sayma ölçüsü ile ilgili olarak bir RND olduğu c ve yana c özelliği olduğunu C ( A ) = 0X~Pois(η)Y~Çöp Kutusu(n,p)PXPYcc , d P Yc(bir)=0bir=

dPYdPX=dPY/dcdPX/dc=fYfX

böylece hesaplayabiliriz

PY(bir)=birdPY
=birdPYdPXdPX=birdPYdPXdPXdcdc
=ΣybirdPYdPX(y)dPXdc(y)=ΣybirfY(y)fX(y)fX(y)=ΣybirfY(y).

P(X=n)>0nY


P«SμdPdS=dP/dμdS/dμ: =p/q


3
0/00/0

1
@whuber yorum için çok teşekkürler, bu gerçekten yardımcı olur. Bunu ele almak için güncellemeye çalıştım
jld
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.