Bir Gizli Markov Modelinde “en iyi” modeli seçme kriterleri


12

Verilerdeki gizli durumların sayısını tahmin etmek için bir Gizli Markov Modeli (HMM) sığdırmaya çalıştığım bir zaman serisi veri var. Bunu yapmak için sahte kodum şudur:

for( i in 2 : max_number_of_states ){ 
    ...
    calculate HMM with i states
    ...
    optimal_number_of_states = "model with smallest BIC"
    ...
}

Şimdi, her zamanki regresyon modellerinde BIC en gösterişli modelleri tercih etme eğilimindedir, ancak HMM durumunda bunun ne yaptığından emin değilim. BIC kriterlerinin ne tür HMM'lere yöneldiğini gerçekten bilen var mı? Ayrıca AIC ve olasılık değerini de elde edebiliyorum. Gerçek toplam devlet sayısını çıkarmaya çalıştığım için, bu ölçütlerden biri bu amaç için diğerinden daha iyi mi?

Yanıtlar:


11

Burada çıktı değişkeninizin kategorik olduğunu varsayıyorum, ancak durum böyle olmayabilir. Yine de, HMM'nin kullanıldığını gördüğümde, durumların sayısı ayarlamayla seçilmek yerine önceden bilinir. Genellikle gözlemlenmeyen bazı iyi anlaşılmış değişkenlere karşılık gelirler. Ancak bu, onunla deney yapamayacağınız anlamına gelmez.

BIC (ve AIC) kullanımındaki tehlike , modeldeki serbest parametre sayısı için k değerinin durum sayısı ile kuadratik olarak artmasıdır, çünkü Px (P-1) parametreleri (P durumları için) ile geçiş olasılığı matrisine sahipsiniz ) ve her bir durumda verilen çıktının her kategorisi için çıktı olasılıkları. Dolayısıyla AIC ve BIC düzgün bir şekilde hesaplanıyorsa, k hızla yukarı çıkmalıdır.

Yeterli veriye sahipseniz, bir tutma örneğinde test etme gibi durumların sayısını ayarlamak için daha yumuşak bir yöntem öneririm. Ayrıca, olasılık istatistiğine bakmak ve yaylaların hangi noktasında görsel olarak görmek isteyebilirsiniz. Ayrıca verileriniz büyükse, bunun BIC'yi daha küçük bir modele iteceğini unutmayın.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.