Özel olasılık dağılımı


12

Eğer p(x) ile sıfır olmayan değerlere sahip bir olasılık dağılımıdır [0,+) hangi tip (ler için,) p(x) bir sabit vardır halen mevcut c>0 öyle ki 0p(x)logp(x)(1+ϵ)p(x(1+ϵ))dxcϵ2tüm0<ϵ<1?

Yukarıdaki eşitsizlik aslında dağılımı p(x)ve sıkıştırılmış bir versiyonu arasında bir Kullback-Leibler Farklılığıdır (1+ϵ)p(x(1+ϵ)). Bu eşitsizliğin Üstel, Gama ve Weibull dağılımları için geçerli olduğunu öğrendim ve bunun daha büyük bir olasılık dağılımları sınıfı için işe yarayıp yaramadığını bilmek istiyorum.

Eşitsizliğin ne anlama geldiğine dair bir fikrin var mı?


3
Yana ϵ , (x-yönünde) sıkıştırılmış yerine gergin olacağını pozitiftir.
Glen_b

2
Bu soru belirsiz: nicelleştiricileriniz neler? Bu eşitsizlik için tutmak ister misin bütün , en az bir £ değenni , ya da başka bir şey? Is c verilen önsel ya da orada olmalı demek en az bir tür değeri var içinde c ? Ve olasılık dağılım sınıflarından bahsettiğiniz için , " p ( x ) " ile belirli bir dağılım mı demek istersiniz, belki de bunların parametrik bir ailesini mi kastediyorsunuz? ϵ ϵccp(x)
whuber

2
@whuber Yorumlarınız için teşekkürler. Bahsedilen sorunları açıklığa kavuşturmak için sorun bildirimimi düzelttim. Demek istediğim, yukarıdaki eşitsizlik hangi için? Cevap ya parametrik bir dağılım ailesi getirmek ya da p ( x ) için istenen eşitsizliği karşılayan ve veren bir diferansiyel denklem önermek olabilir . p(x)p(x)
Sus20200

2
Bu eşitsizlik, sürekli ve sonsuz desteğe sahip herhangi bir p (x) için işe yaramaz mı? KL diverjansını parametrik bir aile içinde hesaplıyorsunuz ( . KL 0'da diferansiyse, türev 0'dır. C'nin KL eğriliğinin maksimum olması ( s [ 0 , 1 ] .), biz bağlı olan ek çalışma ile, p özelliklerinden bağlı C mümkün olabilirϵp(x(1+ϵ))Cϵ[0,1]
Guillaume Dehaene

1
L=limx0p(x)x=0Lϵ+O(ϵ2)

Yanıtlar:


4

Hazırlıklar

Yazmak

Ip(ϵ)=0p(x)log(p(x)(1+ϵ)p(x(1+ϵ)))dx.

Logaritmalar ve ve arasındaki ilişki, hem hem de argümanını üs olarak ifade etmeyi önerir . Bu amaçla tanımlayınp(x)p(x(1+ϵ))p

q(y)=log(p(ey))

sağ tarafın tanımlandığı ve yerde eşit olan tüm gerçek için . Uyarı bu değişkenlerin değişimi gerektirir bir ve (alarak olduğu yoğunluk Kanunu Toplam olasılığı ve böylece olarak ifade edilebilir bir dağılım)yp(ey)=0x=eydx=eydyp

(1)1=0p(x)dx=Req(y)+ydy.

olduğunda olduğunu varsayalım . eq(y)+y0y± Bu , yoğunluk dağılımını veya yakınındaki sonsuz sayıda sivri uçlu olasılık dağılımlarını . Özellikle, kuyrukları sonunda monotonik ise, bu varsayımı ima eder ve ciddi olmadığını gösterir.p0p(1)

Logaritmalarla çalışmayı kolaylaştırmak için şunları da gözlemleyin:

1+ϵ=eϵ+O(ϵ2).

Aşağıdaki hesaplamalar katlarına kadar gerçekleştirileceğinden ,ϵ2

δ=log(1+ϵ).

Biz de yerine geçebilir göre ile, tekabül ve pozitif pozitif karşılık gelen .1+ϵeδδ=0ϵ=0δϵ

analiz

Eşitsizliğin başarısız olabileceği bariz bir yol, integral un bazı ' e sapması olacaktır. ne kadar küçük olursa olsun, aynı sıfır olduğu ancak aralığında sıfır olmadığı herhangi bir uygun aralık . pozitif olasılıkla sonsuz.Ip(ϵ)ϵ(0,1][u,v]pp[uϵ,vϵ]

Sorusu doğası ile ilgili spesifik olduğu için , biz düzgün şekliyle ilgili teknik konularda bogged olabilir olabilir. Her yerde kullanmayı düşündüğümüz kadar çok türevi olduğunu varsayarak, hala bir fikir edinmeyi umarak bu tür sorunlardan kaçınalım . ( sürekli ise iki tane yeterli olacaktır .) Bu garanti herhangi bir sınırlı kümede sınırlı kalması nedeniyle, olduğunda in asla sıfır olmadığı anlamına gelir .ppqqqp(x)x>0

Sorusu gerçekten davranışını ilgili olduğunu Not olarak yukarıdan sıfıra yaklaşır. Bu bütün sürekli bir fonksiyonu olduğu için aralığında , bazı maksimum elde ediyor zaman pozitif aralığı ile sınırlıdır seçmek için olanaklı kılar, , çünkü belli kiIp(ϵ)ϵϵ(0,1]Mp(a)ϵ[a,1]c=Mp(a)/a2

cϵ2=Mp(a)(ϵa)2Mp(a)Ip(ϵ)

eşitsizliği işe yaratır. Bu yüzden sadece modulo hesaplama ile ilgilenmemiz gerekiyor .ϵ2

Çözüm

Değişkenin değişimler için den, için ve için , edelim hesaplamak ikinci sipariş yoluyla (ya da elde umuduyla) basitleştirme. Bu amaçla tanımlayınxypqϵδIp(ϵ)ϵδ

R(y,δ)δ2=q(y+δ)q(y)δq(y)

etrafında Taylor genişlemesinde sıra- kalanı olmak .2qy

Ip(ϵ)=Req(y)+y(q(y)q(y+δ)δ)dy=Req(y)+y(δ+δq(y)+R(y,δ)δ2)dy=δReq(y)+y(1+q(y))dyδ2Req(y)+yR(y,δ)dy.

İçin değişkenler değiştirme , aşağıdaki varsayım belirttiği gibi, bu sıfır olmalıdır sol yekpare gösterir . Sağ el integralinde değişkenlerin tekrar olarak değiştirilmesiq(y)+y(1)x=ey

Ip(ϵ)=δ2Rp(x)R(log(x),δ)dy=δ2Ep(R(log(x),δ)).

Eşitsizlik (çeşitli teknik varsayımlarımıza göre) ve sadece sağ taraftaki katsayısı sonlu ise geçerlidir.δ2

yorumlama

: Esastır sorunu ortaya çıkarmaya görünür, çünkü bu, durdurmak için iyi bir nokta bir kuadratik fonksiyonu ile sınırlanan Taylor genişleme kuadratik hata tam olarak ne zaman değil patlaması (dağılıma göre) yaklaştıkça .Ip(ϵ)ϵqy±

Şu soruda bahsedilen bazı durumları kontrol edelim: Üstel ve Gama dağılımları. (Üstel Gama'nın özel bir örneğidir.) Hiçbir zaman ölçek parametreleri hakkında endişelenmemize gerek yoktur, çünkü sadece ölçüm birimlerini değiştirirler. Sadece ölçek dışı parametreler önemlidir.

Burada, için için , Keyfi çevresinde Taylor genişleme olanTaylor'ın Remainder ile Teoremi, yeterince küçük için baskın olduğu anlamına gelir . beklentisi sonlu olduğu için eşitsizlik Gama dağılımları için geçerlidir.p(x)=xkexk>1

q(y)=ey+kylogΓ(k+1).
y
Constant+(key)δey2δ2+.
R(log(x),δ)ey+δ/2<xδx

Benzer hesaplamalar, Weibull dağılımları, Yarı-Normal dağılımları, Lognormal dağılımları, vb. İçin eşitsizliği ima eder. Aslında, karşı numuneler elde etmek için, en azından bir varsayımı ihlal etmemiz gerekir , bu da belirli bir aralıkta yok olduğu veya sürekli iki kez farklılaştırılamaz veya sonsuz sayıda modu vardır. Bunlar, istatistiksel modellemede yaygın olarak kullanılan herhangi bir dağıtım ailesine uygulamak için kolay testlerdir.p

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.