Bayesian çevrimiçi değişim noktası tespiti (marjinal tahmin dağılımı)


9

Adams ve MacKay ( link ) tarafından yapılan Bayesian çevrimiçi değişim noktası tespit belgesini okuyorum .

Yazarlar marjinal tahmin dağılımını yazarak başlar:

P(xt+1|x1:t)=rtP(xt+1|rt,xt(r))P(rt|x1:t)(1)
nerede
  • xt o zaman gözlem mi t;
  • x1:t zamana kadar gözlem kümesini belirtir t;
  • rtNgeçerli çalışma uzunluğudur (son değişiklik noktasından bu yana geçen süre, 0 olabilir); ve
  • xt(r) koşuyla ilişkili gözlem kümesidir rt.

Denk. 1 resmi olarak doğrudur (@JuhoKokkala'nın aşağıdaki cevabına bakınız), ama benim anlayışım aslındaxt+1 aşağıdaki gibi genişletmeniz gerekir:

P(xt+1|x1:t)=rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b)

Benim akıl yürütmem (gelecek) zamanda bir değişim noktası olabileceğidir t+1, ancak arka P(rt|x1:t) sadece t.

Mesele şu ki, makaledeki yazarlar bizi Eq. 1 olduğu gibi (bkz. Kağıttaki Denklemler 3 ve 11) ve 1b değil . Yani, görünüşte bir değişim noktası olasılığını görmezden geliyorlart+1 tahmin ederken xt+1 mevcut verilerden t. Bölüm 2'nin başında en geç

Tahmin dağılımını hesaplayabileceğimizi varsayıyoruz [ xt+1] belirli bir çalışma uzunluğuna bağlı rt.

belki de hile nerede. Ancak genel olarak, bu öngörücü dağılım Denklem gibi görünmelidir. 1b; ki yaptıkları bu değildir (Denk. 11).

Neler olduğunu anladığımdan emin değilim. Belki de gösterimle ilgili komik bir şeyler var.


Referans

  • Adams, RP ve MacKay, DJ (2007). Bayesian çevrimiçi değişiklik noktası tespiti. arXiv ön baskı arXiv: 0710.3742.

Potansiyel bir açıklama şudur: rtzaman adımının sonundaki çalışma uzunluğunu temsil edert, o zaman değişiklik noktasından sonrat. Bununla, Denk. 1 mantıklı. Aslında, algoritmanın bir başlatılmasıP(r0=0)=1 bu, başlangıçtaki başlangıçtan hemen önce bir değişiklik noktası olduğunu varsayar. t=1. Bununla birlikte, Şekil 1 yanlıştır (veya en azından yanıltıcıdır);t=4 ve t=5ve arasında t=10 ve t=11 Şekil 1a'da gösterildiği gibi, r4 ve r10 bu gösterime göre 0 olmalı, değil r5 ve r11Şekil lb'ye göre.
lacerbi

1
Denklemde garip bir şeyler oluyor. Son satırdaki toplamda orta faktör olarak 3 P(xtrt1,xt(r)) düşünürken xt(r) içeren xt. Şüpheliyimt ve t1 yer değiştirdi P(xtrt,xt1(r))mantıklı olurdu. Denk. 11, sağ tarafa bağlı gibi görünüyorxt(r)sol tarafta hiç görünmüyor, bu yüzden ya yanlış bir şey var ya da gösterimi hiç anlamıyorum.
Juho Kokkala

@JuhoKokkala: Bu duyguya sahip olan tek kişi olmadığım için mutluyum ...
lacerbi

1
@lacerbi, bu yazı hakkında başka bir sorum daha var ve işe aşina olduğunuzdan buna cevap verebileceğinizi düşünüyorum: stats.stackexchange.com/questions/419988 .
gwg

Yanıtlar:


5

Hem (1) hem de (1b) doğrudur. OP'nin (bu modelde) şu noktada bir değişiklik noktası olabileceği hakkı var:t+1, ve xt+1bir değişiklik noktasının olup olmadığına bağlıdır. Bu, (1) 'in olası değerleri olarak herhangi bir sorun olduğu anlamına gelmez.rt+1 tarafından tamamen "kapsanır" P(xt+1rt,x1:t). P(xt+1|rt,x1:t) koşullu dağılımı anlamına gelir. xt+1 şartlı (rt,x1:t). Bu koşullu dağılım ortalamaları "diğer her şey" üzerinde,rt+1, şartlı (rt,x1:t). Tıpkı birinin yazabileceği gibi,P(xt+1000|xt)Bu, değişiklik noktalarının tüm olası yapılandırmalarını ve değerlerini dikkate alır. xiarasında meydana gelen t ve t+1000.

Geri kalanında önce (1) ve sonra (1b) 'ye göre (1b) türetiyorum.

Türetilmesi (1)

Herhangi bir rastgele değişken için A,B,C, sahibiz

P(AB)=cP(AB,C=c)P(C=cB),
olduğu sürece Cayrıktır (aksi takdirde toplamın bir integralle değiştirilmesi gerekir). Bunu uygulayarakxt+1,x1:t,rt:

P(xt+1x1:t)=rtP(xt+1rt,x1:t)P(rtx1:t),
arasındaki bağımlılıklar ne olursa olsun rt, x1:t, xt+1yani henüz hiçbir model varsayımı kullanılmamıştır. Mevcut modelde,xt+1 verilmiş rt,xt(r) koşullu olarak aşağıdaki değerlerden bağımsız olduğu varsayılır * x önceki koşulardan xt(r). Bu ima ederP(xt+1rt,x1:t)=P(xt+1rt,xt(r)). Bunu önceki denkleme koyarsak,

P(xt+1x1:t)=rtP(xt+1rt,xt(r))P(rtx1:t),(1)
OP'de (1) olan

(1b) 'nin türetilmesi

Hadi ayrışmasını düşünelim P(xt+1rt,xt(r)) olası değerleri rt+1:

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,rt,xt(r))P(rt+1rt,xt(r)).

Bir değişiklik noktasının oluşup oluşmadığı * varsayıldığı için t+1 (arasında xt ve xt+1) tarihine bağlı değildir x, sahibiz P(rt+1rt,xt(r))=P(rt+1rt). Ayrıca,rt+1 olup olmadığını belirlemek xt+1 aynı koşula ait xt, sahibiz P(xt+1rt+1,rt,xt(r))=P(xt+1rt+1,xt(r)). Bu iki basitleştirmeyi yukarıdaki çarpanlara ayırmak yerine,

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,xt(r))P(rt+1rt).
Bunu (1) 'e koyarak,
P(xt+1x1:t)=rt(rt+1P(xt+1rt+1,xt(r))P(rt+1rt))P(rtx1:t),(1b)
ki OP'ler (1b).

* Modelin koşullu bağımsızlık varsayımlarına ilişkin açıklama

Makaleye hızla göz atmaya dayanarak, kişisel olarak koşullu bağımsızlık özelliklerinin bir yerde daha açık bir şekilde ifade edilmesini istiyorum, ancak niyetin r Markovyan ve x: farklı çalışmalarla ilişkili s bağımsızdır (çalışma verildiğinde).


1
(+1) Teşekkürler. Evet, elbette, Denk. 1, üstü kapalı bir marjinalleştirme varsa,rt+1. Sorun şu ki, daha sonra yazarlar tahminlerde bulunurlar (makalede Denk. 11 ve örtük olarak Denk. 3) ve görünüşe göre marjinalleşmiyorlar.rt+1onları aldıklarında.
lacerbi

1
Ah. Görünüşe göre soruyu yanlış anladım - bunu silmeli miyim? Soruyu açıklığa kavuşturmak isteyebilirsiniz, şu anda (1) bir şekilde yanlış (belki de yararlı değil) gibi görünüyor
Juho Kokkala

Lütfen değerli olan bu cevabı saklayın. Orijinal yazımda yeterince açık olmadığımdaki hatam. Yorumunuz sayesinde sorumu açıklığa kavuşturmaya çalıştım ve bu cevabı hala anlamlı kılan bir şekilde.
lacerbi
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.