Olasılıkların oranı ve PDF'lerin oranı


12

Kümeleme sorununu çözmek için Bayes kullanıyorum. Bazı hesaplamalar yaptıktan sonra iki olasılık oranını elde etme ihtiyacım var:

P(A)/P(B)

elde edebilme . Bu olasılıklar, bu cevapta açıklandığı gibi iki farklı 2D çok değişkenli KDE'nin entegrasyonu ile elde edilir :P(H|D)

P(A)=x,y:f^(x,y)<f^(ra,sa)f^(x,y)dxdy
P(B)=x,y:g^(x,y)<g^(rb,sb)g^(x,y)dxdy

burada f^(x,y) ve g^(x,y) KDE'lerdir ve entegrasyon f^(ra,sa) ve \ hat { eşiklerinin altındaki tüm noktalar için yapılır g} (r_b, bulanık)g^(rb,sb) . Her iki KDE de bir Gauss çekirdeği kullanır . Çalıştığımdakine benzer bir KDE'nin temsili bir görüntüsü burada görülebilir: Çekirdek yoğunluğu tahmincisini 2B'ye entegre etme .

Bir pythonişlev stats.gaussian_kde işleviyle KDE'leri hesaplıyorum , bu yüzden bunun için aşağıdaki genel formu varsayıyorum:

KDE(x,y)=1ni=1n12h2e(xxi)2+(yyi)22h2

burada nnoktalarının zaman Dizinin uzunluğu ve hkullanılan bant genişliği.

Yukarıdaki integraller, oldukça hesaplamalı olarak pahalı olan bir Monte Carlo işlemi uygulanarak hesaplanır. Bu gibi durumlarda, olasılıklar oranını, eşit derecede geçerli sonuçlar elde etmek için eşik noktalarında değerlendirilen PDF'lerin (KDE'ler) oranıyla değiştirmenin mümkün olduğunu bir yerde okudum (nerede unuttum, üzgünüm). KDE'lerin oranının hesaplanması, MC ile integrallerin oranını hesaplamaktan daha büyük büyüklük sıralarıdır.

Böylece soru bu ifadenin geçerliliğine indirgenmiştir:

P(A)P(B)=f^(ra,sa)g^(rb,sb)

Hangi koşullar altında, varsa, bu ilişkinin doğru olduğunu söyleyebilir miyim?

[sabit yazım hatası (EDIT)]


Ekle :

İşte temel olarak aynı soru ama daha matematiksel bir formda.


1
Uygun integraller için ortalama değerli teorem ile sağlandığını unutmayın. ra,b,sa,b
Dave

1
Değirmen Oranının alakalı olabileceğine inanıyorum .
whuber

@whuber görünüşe göre ben P(X)hesaplamak kaçınmaya çalışıyorum olan değeri olduğunu bilmek gerektirir . Bu parametrenin alaka düzeyine göre biraz genişletebilir misiniz?
Gabriel

Yanıtlar:


3

KDE, Normal dağılımların bir karışımıdır. Bir tanesine bakalım.

ve tanımları, değerlerinin düzlemdeki çeviriler ve yeniden ölçeklendirmeler altında değişmez olduğunu gösterir, bu nedenle PDF ile standart Normal dağılımı dikkate almak yeterlidir . EşitsizlikP(A)P(B)f

f(x,y)f(r,s)

eşittir

x2+y2r2+s2.

Kutupsal koordinatlar , integralin yeniden yazılmasına izin verirρ,θ

P(r,s)=12π02πr2+s2ρexp(ρ2/2)dρdθ=exp((r2+s2)/2)=2πf(r,s).

Şimdi karışımı düşünün. Doğrusal olduğu için,

P(r,s)=1ni2πf((rxi)/h,(syi)/h)=2πh2(1ni1h2f((rxi)/h,(syi)/h))=2πh2KDE(r,s).

Aslında, ve orantılıdır. Orantılılık sabiti .fP2πh2


ve arasındaki böyle bir orantılılık ilişkisinin özelPf olması, basit bir karşı örnek düşünülerek takdir edilebilir. Let ölçülebilir grubu üzerinde muntazam bir dağılımı birim alan ve ölçülebilir grubu üzerinde muntazam bir dağılımı gelen ayrık olan ve alan vardır . Daha sonra PDF ile karışım sabit bir değere sahip ile , üzerinde , ve başka bir yerde, sıfırdır. Dikkate alınması gereken üç durum vardır:f1A1f2A2A1μ>1f=f1/2+f2/21/2A11/(2μ)A2

  1. (r,s)A1 . Burada 1/2 maksimuma, ulaşır . oranı .f(r,s)=1/2P(r,s)=1f(r,s)/P(r,s)=1/2

  2. (r,s)A2 . Burada kesinlikle 2'den küçük ama büyüktür . Böylece entegrasyon bölgesi tamamlayıcısıdır ve ortaya çıkan integral / eşit olmalıdır . oranı .f(r,s)1/20A11/2f(r,s)/P(r,s)=(1/(2μ))/(1/2)=1/μ

  3. Başka yerlerde, sıfırdır ve integrali sıfırdır.fP

Açıkça görüldüğü gibi (tanımlandığı yerde) oran sabit değildir ve ile arasında değişir . Bu dağılım sürekli olmamakla birlikte, buna Normal dağıtım eklenerek yapılabilir . her iki özdeğerini de küçük yaparak , dağılımı çok az değiştirecek ve niteliksel olarak aynı sonuçları üretecektir - ancak şimdi oranının değerleri aralıktaki tüm sayıları içerecektir .11/μ1(0,Σ)Σf/P[1,1/μ]


Bu sonuç diğer boyutlara da genelleme yapmaz. Aslında bu cevabı başlatan aynı hesaplama, eksik bir Gamma fonksiyonu olduğunu ve açıkça aynı olmadığını gösterir . İki boyutlu özel entegrasyon belirterek tarafından takdir edilebilir olduğu esas ilgilidir mesafeleri ve ne zaman, normal olarak dağıtılır, mesafe işlevi vardır olduğu - dağıtım üstel dağılım. Üstel fonksiyon kendi türevi ile orantılı olarak benzersizdir - bu nedenle ve integral orantılı olmalıdır.PfPχ2(2)fP


Bu inanılmaz bir cevap whuber, çok teşekkür ederim. Burada yazdığınız her şeyi tam olarak işlemem biraz zaman alacaktır, ancak size hesaplamalara tamamen güveniyorum, bu da soruyu çözülmüş olarak işaretlediğim anlamına geliyor. Şerefe.
Gabriel
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.