Olasılıksal programlama ile anahtar noktası tespiti (pymc)

9

Şu anda Hackerlar için Olasılıksal Programlama ve Bayesian Yöntemleri "kitabını" okuyorum . Birkaç bölüm okudum ve pymc ile ilk örnek metin mesajları bir cadı noktası tespit oluşan ilk Bölüm üzerinde düşünüyordum. Bu örnekte, anahtarlama noktasının ne zaman gerçekleştiğini gösteren rastgele değişken ile gösterilir . MCMC adımından sonra posterior dağılımı verilir: $\tau$ $\tau$ resim açıklamasını buraya girin

Birincisi, bu grafikten öğrenilebilen şey, 45. günde anahtar noktasının gerçekleşme olasılığının yaklaşık% 50 olması. Peki bir anahtar noktası olmasaydı? Bir anahtar noktası olduğunu varsaymak ve sonra onu bulmaya çalışmak yerine, aslında bir anahtar noktası olup olmadığını tespit etmek istiyorum.

Yazar, "Bir değişim noktası oldu mu?" Sorusunu "Değişim olmamışsa veya zaman içinde kademeli olarak değişmiş olsaydı , arka dağılımı daha fazla yayılmış olurdu " sorusunu yanıtlar . Ancak bunu bir olasılıkla nasıl cevaplayabilirsiniz, örneğin bir anahtar noktasının gerçekleşme şansı% 90 ve 45. günde gerçekleşme şansı% 50'dir. $\tau$

Modelin değiştirilmesi gerekiyor mu? Yoksa bu mevcut modelle cevaplanabilir mi?

— Olivier_s_j
kaynak

Aşağıda benimkinden daha iyi bir cevabı olabilecek kitap yazarı @ Cam.Davidson.Pilon'dan bahsediyoruz.

— Sean Easter

6

SeanEaster'ın bazı iyi tavsiyeleri var. Bayes faktörünün hesaplanması zor olabilir, ancak PyMC2'de özellikle Bayes faktörü için bazı iyi blog gönderileri vardır.

Yakın ilişkili bir soru, bir modelin uyum iyiliğidir. Bunun için adil bir yöntem sadece teftiştir - posterler bize uyum iyiliği kanıtı verebilir. Alıntılanan gibi:

"Hiçbir değişiklik olmasaydı ya da zaman içinde değişim kademeli olsaydı , posterior dağılımı daha fazla yayılırdı" $\tau$

Bu doğru. Posterior 45 zamana oldukça yakındır. Dediğiniz gibi kütlenin% 50'si 45'tir, oysa anahtar noktası yoksa kütle (teorik olarak) 45. dakikada 1/80 = 1.125'e yakın olmalıdır.

Yapmayı amaçladığınız, modeliniz göz önüne alındığında, gözlemlenen veri setini sadakatle yeniden yapılandırmaktır. In Bölüm 2 , sahte verileri oluşturmaya simülasyonları onların bulunmaktadır. Gözlenen verileriniz yapay verilerinizden çılgınca farklı görünüyorsa, büyük olasılıkla modeliniz uygun değildir.

Titiz olmayan cevap için özür dilerim, ama gerçekten etkili bir şekilde üstesinden gelemediğim büyük bir zorluk.

— Cam.Davidson.Pilon
kaynak

Belki cevabınızla ilgisiz, sadece yüksek sesle düşünüyorum. Verilere bir sigmoid yerleştirmek mümkün olmaz mı ve beta parametresine dayanarak eğimin bir değişiklik gösterip göstermediğine karar verir. Belki bir anahtar noktasının olup olmadığını belirleyen eşik, o zaman örneklerden öğrenilebilir. Belki parametreleriyle de mümkündür . Eğer çok fazla 1 farklıdır 2 başka bir switchpoint değil bulunmaktadır. Bu, aynı zamanda örneklerden öğrenilen bir eşik ile de yapılabilir

λ

$\lambda$

λ

$\lambda$

λ

$\lambda$

— Olivier_s_j

1

Örneğin, şu modeli : ; burada ? Bu işe yarayacağına inanıyorum ve yumuşak geçişlere izin verecek. eğimindeki çıkarımın bir anahtarlama noktasının mevcut olup olmadığını belirleyebildiniz. Bunu gerçekten seviyorum, daha fazla keşfetmelisin.

λ_{1} p + λ_{2} (1 - p)

$\lambda_1 p + \lambda_2 (1-p)$

p = 1 / (1 + e x p (- β t))

$p = 1/(1 + exp(-\beta t) )$

β

$\beta$

— Cam.Davidson.Pilon

Model uyumu sorusunda, posterior öngörücü p-değerlerinin uyumu değerlendirmenin bir yolu olduğunu eklerim. Bu makaleye bakın .

— Sean Easter

2

Bu daha çok bir model karşılaştırma sorusudur: İlgi alanı, anahtar noktası olmayan bir modelin verileri anahtar noktası olan bir modelden daha iyi açıklayıp açıklamamasıdır. Bu soruyu cevaplamak için bir yaklaşım, bir anahtar noktası olan ve olmayan modellerin Bayes faktörünü hesaplamaktır . Kısacası, Bayes faktörü her iki modelde de verilerin olasılık oranıdır:

$K = \frac{\Pr(D|M_1)}{\Pr(D|M_2)} =\frac{\int\Pr(\theta_1|M_1)\Pr(D|\theta_1,M_1)\,d\theta_1}{\int \Pr(\theta_2|M_2)\Pr(D|\theta_2,M_2)\,d\theta_2}$

Eğer bir switchpoint kullanarak modeldir ve sonra için yüksek bir değer olmadan modeli olan kuvvetle switchpoint modeli lehine olarak yorumlanabilir. (Yukarıda bağlanan wikipedia makalesi, K değerlerinin dikkat çektiği hususlar için yönergeler verir.) $M_1$ $M_2$ $K$

Ayrıca, bir MCMC bağlamında yukarıdaki integrallerin MCMC zincirlerindeki parametre değerlerinin toplamlarıyla değiştirileceğini unutmayın. Bayes faktörlerinin örneklerle daha kapsamlı bir tedavisi burada mevcuttur .

Bir anahtarlama noktasının olasılığını hesaplamak için, bu için çözülmeye eşdeğerdir . İki model arasında eşit öncelikler varsa, modellerin arka oranları Bayes faktörüne eşdeğerdir. (Bkz slayt 5 burada .) Sonra onun için çözme meselesi Bayes faktörü ve bu şartı kullanılarak n için dikkate alınan (münhasır) model olaylar. $P(M_1|D)$ $P(M_1|D)$ $\sum\limits_{i=1}^n P(M_i|D) = 1$

— Sean Paskalya
kaynak