Bir olasılık grafik modeli (PGM) kompakt rastgele değişkenin bir dizi üzerinde ortak olasılık dağılımları ve (in) bağımlılık ilişkileri modellemek için bir grafiktir formalizmdir. Alttaki grafik yönlendirildiğinde PGM, Bayesian ağı ve Markov ağı / Markov rastgele alanı olarak adlandırılır.temel grafik yönlendirilmediğinde. Genel olarak konuşursak, eskiyi net bir yönelime sahip değişkenler arasındaki muhtemel etkiyi modellemek için kullanırsınız, aksi takdirde ikincisini kullanırsınız; PGM'lerin her iki versiyonunda da, ilişkili grafiklerdeki kenarların olmaması, kodlu dağılımlardaki koşullu bağımsızlıkları temsil etse de, bunların kesin anlamları farklıdır. "Markov ağı" ndaki "Markov", tarafından kodlanan, diğerlerinden bağımsız olduğu, bazı "önemli" değişkenlerinin (teknik ismi bir Markov; battaniye ), yani .xbirxCxBp ( xbir| xB, xC) = p ( xbir| xB)
Bir Markov süreci bir stokastik süreçtir ye uyan Markov özelliği . Burada vurgu, (skaler) rastgele değişkenler olan genellikle zamana göre endeksli olduğu düşünülen, belirli bir koşullu bağımsızlığı sağlayan yani "gelecek geçmişten bağımsızdır" diye düşünülmüş. şimdiki zaman verilen, . Bu, PGM'ler tarafından tanımlanan 'Markov' kavramının özel bir halidir: basitçe kümesini alın ve alt kümesi olarak alın ve önceki ifadeyi çağır{ Xt}x 1 , x 2 , X- 3 , . . . p ( x t + 1 | x t , X t - 1 , . . . , x 1 ) = p ( x t + 1 | x t ) bir = { t + 1 } , B = { tX1, X2, X3, . . .p ( xt + 1| xt, xt - 1, . . . , x1) = p ( xt + 1| xt)A = { t + 1 } , B = { t }C{ T - 1 , t - 2 , . . . , 1 }p ( xbir| xB, xC) = p ( xbir| xB)X, t + 1 X, t . Bundan herhangi bir değişkeninin Markov örtüsünün selefi .Xt + 1Xt
Bu nedenle , bir Bayes şebekesiyle bir Markov sürecini temsil edebilirsiniz , zamana göre dizine alınmış bir doğrusal zincir olarak (basitlik için, burada sadece ayrık zaman / durum durumunu düşünürüz; Bishop'un PRML kitabındaki resim):
Bu tür bir Bayesian ağı dinamik Bayesian ağı . Bir Bayesian ağı olduğu için (dolayısıyla bir PGM), olasılıkla çıkarım (Chapman-Kolmogorov Denklemlerinin özel bir durumu temsil ettiği toplam-ürün algoritması gibi) ve parametre kestirimi (örneğin, kaynama kabiliyetinin maksimum olması gibi) için standart PGM algoritmaları uygulanabilir. zincir üzerinde basit saymaya). Bunun örnek uygulamaları HMM ve n-gram dil modelidir.
Çoğu zaman bunun gibi bir Markov zincirinin bir tasvirini görürsünüz
Bu bir PGM değildir , çünkü düğümler rasgele değişkenler değil, zincirin durum alanının öğeleridir; kenarlar ardışık iki durum arasındaki (sıfır olmayan) geçiş olasılıklarına karşılık gelir. Bu grafiği, PGM zincirinin (koşullu olasılık tablosu) tanımladığı gibi düşünebilirsiniz . Bu Markov zinciri, her zaman damgasında dünyanın durumunu sadece rastgele bir değişken ( Mood ) olarak kodlar ; ne diğer etkileşim (gibi dünyanın yönlerini yakalamak istiyorsanız Sağlık ve Gelir bazı kişileri) ve tedavi rasgele değişkenlerin bir vektörü olarakp ( Xt| Xt - 1)Xt( X( 1 )t, . . . X( D )t)? PGM'lerin (özellikle de dinamik Bayesian ağlarının) yardım edebileceği yer burasıdır. için karmaşık dağılımları basit bir zincir Bayesian ağının meraklısı bir sürümü olarak düşünülebilecek
tipik bir 2TBN (2 dilimli dilimli Bayesian ağı) olarak adlandırılan koşullu bir Bayesian ağı kullanarak .p ( X( 1 )t, . . . X( D )t| X( 1 )t - 1, . . . X( D )t - 1)
TL; DR : Bir Bayesian ağı, bir değişkenler üzerinde faktörlenmiş olasılık dağılımını ve ilişkili koşullu bağımsızlığı temsil etmek için yönlendirilmiş (asiklik) bir grafik kullanan bir çeşit PGM'dir (olasılıksal grafik modeli). Markov süreci, "geleceğin şimdiki zamandan bağımsız olması" özelliği ile stokastik bir süreçtir (tipik olarak rastgele değişkenler topluluğu olarak düşünülür); vurgu, zaman içinde tek "şablon" rasgele değişken (genellikle ) evrimi üzerinde çalışmaktır . A (skalar) Markov işlemi, belirli koşullu bağımsızlık özelliğiniXtt → ∞p ( xt + 1| xt, xt - 1, . . . , x1) = p ( xt + 1| xt)ve bu nedenle, bir zincir Bayesian ağı ile önemsiz bir şekilde temsil edilebilir; oysa dinamik Bayesian ağları, zaman içinde çoklu rastgele değişkenler (yani rastgele vektörler) arasındaki etkileşimleri modellemek için PGM'lerin tam temsil gücünden yararlanabilir; Bu konuda büyük bir referans Daphne Koller'in PGM kitabı bölüm 6'dır.