Kümeleme sorununu çözmek için Bayes kullanıyorum. Bazı hesaplamalar yaptıktan sonra iki olasılık oranını elde etme ihtiyacım var:
elde edebilme . Bu olasılıklar, bu cevapta açıklandığı gibi iki farklı 2D çok değişkenli KDE'nin entegrasyonu ile elde edilir :
burada ve KDE'lerdir ve entegrasyon ve \ hat { eşiklerinin altındaki tüm noktalar için yapılır g} (r_b, bulanık) . Her iki KDE de bir Gauss çekirdeği kullanır . Çalıştığımdakine benzer bir KDE'nin temsili bir görüntüsü burada görülebilir: Çekirdek yoğunluğu tahmincisini 2B'ye entegre etme .
Bir python
işlev stats.gaussian_kde işleviyle KDE'leri hesaplıyorum , bu yüzden bunun için aşağıdaki genel formu varsayıyorum:
burada n
noktalarının zaman Dizinin uzunluğu ve h
kullanılan bant genişliği.
Yukarıdaki integraller, oldukça hesaplamalı olarak pahalı olan bir Monte Carlo işlemi uygulanarak hesaplanır. Bu gibi durumlarda, olasılıklar oranını, eşit derecede geçerli sonuçlar elde etmek için eşik noktalarında değerlendirilen PDF'lerin (KDE'ler) oranıyla değiştirmenin mümkün olduğunu bir yerde okudum (nerede unuttum, üzgünüm). KDE'lerin oranının hesaplanması, MC ile integrallerin oranını hesaplamaktan daha büyük büyüklük sıralarıdır.
Böylece soru bu ifadenin geçerliliğine indirgenmiştir:
Hangi koşullar altında, varsa, bu ilişkinin doğru olduğunu söyleyebilir miyim?
[sabit yazım hatası (EDIT)]
Ekle :
İşte temel olarak aynı soru ama daha matematiksel bir formda.
P(X)
hesaplamak kaçınmaya çalışıyorum olan değeri olduğunu bilmek gerektirir . Bu parametrenin alaka düzeyine göre biraz genişletebilir misiniz?