üzerinde desteklenen yoğunluğuna sahip sürekli bir dağıtımdan veri olduğunu varsayalım , ancak oldukça büyük olduğundan çekirdek yoğunluğu (örneğin) tahmin, oldukça doğrudur. Belirli bir uygulama için, gözlenen kütle fonksiyonu olan yeni bir veri kümesi elde etmek için gözlenen verileri sınırlı sayıda kategoriye dönüştürmem gerekiyor .
olduğunda basit bir örnek ve olduğunda . Bu durumda indüklenen kütle fonksiyonu
Burada iki "ayar parametresi" grup sayısı, ve eşiklerinin uzunluk vektörüdür . İndüklenen kütle fonksiyonunu belirtin .
Örneğin, " için en iyi seçenek nedir, böylelikle grup sayısını yükseltmek (ve orada optimal seçmek ) ihmal edilebilir bir iyileşme sağlamak için cevap veren bir prosedür istiyorum. " . Belki de dağılımı türetilebilen bir test istatistiği (belki de KL diverjansındaki farklılık veya benzeri bir şeyle) oluşturulabilir gibi hissediyorum. Herhangi bir fikir veya ilgili literatür?
Düzenleme: Ben sürekli değişken geçici aralıklı ölçümleri var ve geçici bağımlılığı modellemek için homojen olmayan bir Markov zinciri kullanıyorum. Açıkçası, ayrık durum markov zincirlerinin kullanımı çok daha kolaydır ve bu benim motivasyonumdur. Gözlenen veriler yüzdelerdir. Şu anda benim için çok iyi görünen özel bir takdir yetkisi kullanıyorum, ancak bunun resmi (ve genel) bir çözümün mümkün olduğu ilginç bir sorun olduğunu düşünüyorum.
Düzenleme 2: Aslında KL sapmasını en aza indirmek, verileri tamamen takdir etmemekle eşdeğerdir, böylece fikir tamamen ortadan kalkar. Bedeni buna göre düzenledim.