Gizli Markov Modeli vs Markov Geçiş Modeli vs Devlet-Uzay Modeli…?


18

Yüksek lisans tezim için, serolojik durumla tanımlanan farklı durumlar arasındaki geçişler için istatistiksel bir model geliştirmeye çalışıyorum. Şimdilik, sorum daha genel / teorik olduğu için bu bağlamda çok fazla ayrıntı vermeyeceğim. Her neyse, sezgim bir Gizli Markov Modeli (HMM) kullanmam gerektiğidir; modelimi formüle etmek için gerekli literatürden ve diğer arka plan araştırmalarından geçerken karşılaştığım sorun, terminoloji ve farklı gizli süreç modelleri arasındaki kesin farklar konusunda kafa karışıklığı. Onları neyin ayırt ettiğini çok belirsiz bir şekilde biliyorum (gelecek örnekler). Dahası, bana öyle geliyor ki, en azından literatürde gördüklerimden, bu tip modelleme etrafında çok standart olmayan bir kelime dağarcığı var,

Bu yüzden, insanların bu terimlerin bazılarını benim için anlamsızlaştırmama yardımcı olacağını umuyordum. Bazı sorularım var, ama bir veya iki kişinin tatmin edici bir şekilde cevaplanmasıyla geri kalanın sonuç olarak çözüleceğini tahmin ediyorum. Umarım bu çok uzun solmaz; Eğer bir moderatör bunu birden fazla gönderiye bölmemi isterse ben yapacağım. Her halükarda, sorularımı koyu yazdım ve arkasından literatür araştırmamda ortaya çıkardığım sorunun detaylarını takip ettim.

Yani, belirli bir sırayla:

1) "Gizli süreç modeli" tam olarak nedir?

"Gizli süreç modeli" nin bir çeşit farklı istatistiksel modeli tanımlamak için kullanılabilecek bir çeşit şemsiye terim olduğu izlenimi altında çalışıyorum, tüm bunlar aslında "örtüşen bir sistem tarafından üretilen zaman serisi verilerinin olasılıksal tanımları, potansiyel olarak gizli, lineer olarak katkı işlemleri "([1]). Gerçekten de, [2] bir “gizli işlem modeli” ni “bir durum-uzay modeline ya da gizli bir Markov modeline atıfta bulunan genel bir terim” olarak tanımlar. [1] gizli bir Markov modelinin, özellikle ikili durumlar üzerinde çıkarım yapmaya yönelik gizli süreç modellerinin bir alt türü olduğu anlaşılmaktadır; temel ima bana gizli bir süreç modelinin gizli bir Markov modelinin genelleştirilmesi olduğu anlaşılıyor. Bazen "gizli süreç modeli" ve "

Bu sezgi benim tarafımdan doğru mu? Değilse, bu yöntemleri daha net tanımlayan bir referansı var mı?

2) Bir Gizli Markov Modeli ile bir durum-uzay modeli arasındaki fark nedir?

Tekrar [2] 'ye geri dönersek (eğer kağıdın net bir terimler sözlüğü ile gelmesi, kağıdın kendisinin özellikle yetkili olduğu için değil; sadece bir cümle tanımlarının uygun bir kaynağı olduğu için), fark şu ki Bir Gizli Markov Modeli, devletlerin Markovian olduğu belirli bir tür durum uzayı modelidir (Markov sürecinin sırası üzerinde kesin bir kısıtlama görünmemektedir; yani birinci derece, ..., kth sırası). Burada bir durum-uzay modeli "İki zaman serisini paralel olarak çalıştıran, biri gerçek durumların (gizli) dinamiğini yakalayan, diğeri ise bu temeldeki ama muhtemelen bilinmeyen durumlardan yapılan gözlemlerden oluşur. Bu durumlar Markov özelliğini de sergiliyorsa, bu bir Gizli Markov Modeli'dir.

Bununla birlikte, [3] durum-uzay modelleri ile Gizli Markov Modelleri arasındaki farkı, gizli durumun özellikleri ile ilişkili olarak tanımlar. Burada, bir Gizli Markov Modeli ayrık durumlarla ilgilenirken, durum-uzay modelleri sürekli durumlarla ilgilenir; aksi takdirde kavramsal olarak aynıdırlar.

Bunlar bana çok farklı iki tanım gibi geliyor. Birinin altında, bir Gizli Markov Modeli, durum-uzay modelinin bir alt tipi iken, diğeri altında, her ikisi de daha geniş bir gizli süreç modelleri sınıfının sadece farklı örnekleridir. Bunlardan hangisi doğrudur? Sezgim beni [2] 'nin aksine [3]' ü takip etmemi işaret ediyor, ama bunu destekleyen yetkili bir kaynak bulamıyorum.

3) "Markov geçiş modeli" nedir?

Birçok kaynakta ortaya çıkan bir diğer terim de "Markov geçiş modeli" dir. Bu ifadeyi herhangi bir ders kitabında bulamadım, ancak dergi makalelerinde çok görünüyor (onaylamak için Google'a takın). Terimin titiz bir tanımını bulamadım (bulduğum her kağıt başka bir kağıttan bahsediyor, başka bir alıntı yapıyor, vb., Bana hiçbir yerden aklı başında bir PubMed tavşan deliği gönderiyor). Bağlamdan izlenimim, çıkarım nesnesinin bir Markov sürecini takip eden durumlar arasındaki geçişler olduğu herhangi bir modele atıfta bulunmak ve Gizli Bir Markov Modelinin belirli bir Markov geçiş modeli olarak kabul edilebileceğidir. . [4] ise geçiş modeli, Gizli Markov Modeli ve benzer terimleri birbirinin yerine kullanıyor gibi görünmektedir.

Öte yandan, [5] Markov geçiş modelleri ve Saklı Markov Modelleri hakkında biraz farklı konuşuyor. Yazarlar şunları söylüyor: "Geçiş modelleri, daha karmaşık gizli Markov modellerinin sonuçlarını yorumlamak için yardımcı olan katılımcı dinamiklerini özetlemek için bir yöntem sunuyor". Bu cümle ile ne anlama geldiğini tam olarak anlamıyorum ve makalenin başka bir yerinde bunun için bir gerekçe bulamıyorum. Bununla birlikte, Markov geçiş modellerinin zamanı sürekli bir değişken olarak kullandığını, gizli Markov modellerinin zamanı ayrık bir değişken olarak kullandığını ima ediyorlar (bunu doğrudan söylemiyorlar; Markov geçişine uymak için R paketi 'msm' kullandıklarını söylüyorlar modeller ve daha sonra 'msm', HMM'ler için R paketinin aksine süreyi sürekli olarak işlemek olarak tanımlar).

4) Dinamik Bayes Ağları gibi diğer kavramlar nereye uyuyor?

Wikipedia'ya göre Dinamik Bayes Ağı, "gizli Markov modellerinin ve Kalman filtrelerinin genelleştirilmesi" dir. Başka bir yerde, dinamik bir Bayes Ağının özel bir örneği olarak tanımlanan gizli Markov modellerini gördüm, "dünyanın tüm durumu tek bir gizli durum değişkeni ile temsil ediliyor" ( Dinamik Bayes sisteminin tanımı ve HMM ile ilişkisi? ) . Genel olarak bu ilişkiyi anlıyorum ve bunu iyi açıklıyor [6].

Ancak, bu ilişkinin daha geniş bir tabloya nasıl uyduğunu anlamakta zorlanıyorum. Yani, HMM'ler ve DBN'ler arasındaki bu ilişki göz önüne alındığında, durum-uzay modelleri ve gizli süreç modelleri ikisi ile nasıl ilişkilidir? Gizli Markov modellerinin birden çok "genellemesi" olduğu düşünüldüğünde, bu farklı yöntemlerin tümü birbiriyle nasıl ilişkilidir?


Referanslar:

[1] Tom M. Mitchell, Rebecca Hutchinson, Indrayana Rustandi. Msgstr "Gizli Süreç Modelleri". 2006. CMU-CALD-05-116. Carnegie Mellon Üniversitesi.

[2] Oliver Giminez, Jean-Dominique Lebreton, Jean-Michel Gaillard, Remi Choquet, Roger Pradel. Msgstr "Gizli işlem dinamik modellerini kullanarak demografik parametreleri tahmin etme". Teorik Nüfus Biyolojisi. 2012. 82 (4): 307-316.

[3] Barbara Engelhardt. Msgstr "Gizli Markov Modelleri ve Durum Uzay Modelleri". STA561: Olasılıksal makine öğrenimi. Duke Üniversitesi.http://www.genome.duke.edu/labs/engelhardt/courses/scribe/lec_09_25_2013.pdf

[4] Jeroen K. Vermunt. "Ambulatuvar Duygudurum Değerlendirme Verilerinin Analizine Bir Uygulama ile Sürekli Zamanda Çok Seviyeli Gizli Markov Modelleme". Sosyal İstatistikler Çalıştayı. 2012. Tilburg Üniversitesi.http://www.lse.ac.uk/statistics/events/SpecialEventsandConferences/LSE2013-Vermunt.pdf

[5] Ken Richardson, David Harte, Kristie Carter. "Sağlık ve işgücü geçişlerini anlama: Markov modellerini SoFIE boyuna verilerine uygulama". Resmi İstatistik Araştırma Serisi. 2012.

[6] Zoubin Ghahramani. "Gizli Markov Modelleri ve Bayes Ağlarına Giriş". Örüntü Tanıma ve Yapay Zeka Dergisi. 2001. 15 (1): 9-42.


Ayrıca Tekrarlayan Bir Sinir Ağı denemek isteyebilirsiniz. Konuşma tanımada, bazıları bunları bir HMM'nin yerine başarıyla kullandı.
Albert

Öneri için teşekkürler. Şu anda yenilerini incelemeye başlamadan önce bu tekniklerle ilgili sorularımı netleştirmeyi tercih ederim.
Ryan Simmons

Aynı şeyi ifade ediyorlar. Lütfen scholarpedia.org/article/State_space_model Sangdon'a bakınız

2
@Ryan Simmons Ben youtube üzerinde markov zincirleri ve gizli markov modelleri hakkında mathematicalmonk (aka Jeffrey Miller) videoları kontrol etmek iyi bir fikir olacağını düşünüyorum.
JimBoy

Tezinizi muhtemelen şimdiye kadar teslim ettiğiniz için, bu soruyu kendiniz cevaplamak ister misiniz? Ben bir uzman için burada cevap istiyorum, ki bu muhtemelen bu soruyu okuyan yaklaşık 800 kişi için de geçerlidir.
Ulf Aslak

Yanıtlar:


4

Scholarpedia web sitesinden alıntılar :

Durum uzayı modeli (SSM), latent durum değişkeni ile gözlemlenen ölçüm arasındaki olasılıksal bağımlılığı tanımlayan bir olasılıksal grafik model sınıfına (Koller ve Friedman, 2009) karşılık gelir. Durum veya ölçüm sürekli veya ayrık olabilir. “Devlet mekânı” terimi 1960'lı yıllarda kontrol mühendisliği alanında ortaya çıkmıştır (Kalman, 1960). SSM, stokastik bir süreçle ölçülen veya gözlemlenen deterministik ve stokastik dinamik sistemleri analiz etmek için genel bir çerçeve sağlar. SSM çerçevesi, çok çeşitli dinamik sistem sorunlarını çözmek için mühendislik, istatistik, bilgisayar bilimi ve ekonomi alanlarında başarıyla uygulanmıştır. SSM'leri tanımlamak için kullanılan diğer terimler gizli Markov modelleri (HMM'ler) (Rabiner, 1989) ve gizli süreç modelleridir. En iyi incelenen SSM, Kalman filtresidir,


3

Ben ve Alan Hawkes, ayrık durumlarla sürekli zaman içinde toplu Markov süreçleri hakkında çok şey yazdık. Bizim şeylerimiz, tek iyon kanal moleküllerinin gözlemlerini yorumlama sorunu ile ilgiliydi ve kaçırılan kısa olayların tam bir tedavisini içeriyor. Benzer teori, güvenilirlik teorisinde de çalışır. Diğer sorunlara iyi adapte olabilir. Referanslar için http://www.onemol.org.uk/?page_id=175 adresine bakın .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.