Parçacık filtrelerini anlamak için matematiksel ve istatistiksel önkoşullar?

10

Şu anda parçacık filtrelerini ve bunların finanstaki olası kullanımlarını anlamaya çalışıyorum ve biraz mücadele ediyorum. (İ) partikül filtrelerinin temellerini erişilebilir kılmak ve (ii) daha sonra bunları tam olarak anlamak için tekrar gözden geçirmem gereken (nicel finansta bir geçmişten gelen) matematiksel ve istatistiksel önkoşullar nelerdir? Henüz ele almadığım durum modelleri hariç, yüksek lisans düzeyinde zaman serisi ekonometrisi hakkında sağlam bir bilgiye sahibim.

Herhangi bir ipucu çok takdir!

time-series particle-filter

— Constantin
kaynak

4

Bayesci istatistik (IMHO) konu için önemlidir. Bir grup bilmenize gerek yok, sadece onunla ilişkili terimleri anladığınızdan emin olun (örn. Öncelik, olasılık, posterior) ve modelleme varsayımlarından nasıl kaynaklandıklarından emin olun

— Yair Daon

1

Doucet'in makalelerini okumak harika bir fikir, o gerçekten iyi bir yazar. Web sitesinde slaytlar / dersler ve videolar da dahil olmak üzere kaynakların kapsamlı bir listesi var ! Ayrıca meslektaşlarından birinden başka bir kapsamlı liste içeriyor .

— bdeonovic

9

Sadece birkaç temel kavramla şok edici bir şekilde uzaklaşabilirsiniz. Gösterim vb değişkenlerin bir patlama ... şeyler yapabilir bak karmaşık, fakat partikül filtreleme çekirdek fikri oldukça basittir.

Anlamanız gereken (ve muhtemelen zaten!) Bazı temel olasılıklar:

Bilgisayar dağıldığı : $P(X = x) = \sum_i P(X = x, Y = y_i)$
Def. Koşullu olasılık: $P(X \mid Y) = \frac{P(X,Y)}{P(Y)}$
Bayes Kuralı: $P(X \mid Y) = \frac{P(Y \mid X) P(X)}{P(Y)}$
Bayes terimleri: örn. önceki, olabilirlik, arka (+1 @Yair Daon, katılıyorum!)

Bir parçacık filtresinin temel adımları inanılmaz derecede basittir:

İlk:

Bazı gizli durumlarla ilgili bazı inançlarla başlayın. Örneğin, roketinizin fırlatma rampasında olduğuna inanarak başlayabilirsiniz. (Bir parçacık filtresinde, gizli durum hakkındaki inançlar bir nokta bulutu ile temsil edilir, her nokta gizli durumun olası bir değerini gösterir. Her nokta aynı zamanda devletin gerçek durum olma olasılığı ile ilişkilidir.)

Sonra zaman gelen güncelleme için aşağıdaki adımları yineleme süresi : $t$ $t+1$

Tahmin adımı: Hareket yasalarına göre noktaların yerini ileri taşı . (örneğin, roketin mevcut hızına, yörüngesine vb. göre puanları ileri hareket ettirin). Bu, belirsizlik arttıkça genellikle puan bulutunu genişletir.
Olasılık güncelleme adımı: Bayes Kuralını kullanarak noktalarla ilişkili olasılıkları güncellemek için verileri, sensör girişini kullanın . Belirsizlik azaldıkça, bu tipik olarak puan bulutunu daraltacaktır.
Belirli adımları / püf noktalarını filtreleyen bazı parçacık ekleyin. Örneğin. :
- Her bir noktanın eşit olasılığa sahip olması için puanlarınızı ara sıra yeniden örnekleyin.
- Biraz gürültüyü karıştırın, olasılık adımınızın (2) puan bulutunuzu çok fazla çökmesini önleyin (partikül filtrelemede, gerçek konumunuzda belirsiz olasılıkla en az bir noktanın olması önemlidir!)

Misal:

Filtrenizi başlatın: - Bulunduğunuz yere bakın. Şimdi gözlerini kapat.

Sonra tekrarlayın:

Gözlerin kapalıyken bir adım ileri git.
Tahmin adım: nerede geçmişin adeta verilmiş edildi ayakta tahmin sen edilir şimdi bir adım ileri verilen ayakta. (Belirsizliğin nasıl genişlediğine dikkat edin, çünkü gözleriniz kapalıyken ileriye doğru attığınız adım süper hassas değildir!)
Güncelleme adımı: Nerede durduğunuz hakkındaki inançlarınızı güncellemek için sensörleri kullanın (örn. Etrafta hissetmek vb.).

TEKRAR ET!

Uygulanması gereken olasılık makineleri temelde sadece temel olasılıktır: Bayes kuralı, marjinal dağılımın hesaplanması vb.

Büyük resmi anlamaya yardımcı olabilecek son derece ilgili fikirler:

Bir anlamda, (1) ve (2) adımları Bayes filtreleme problemlerinde ortaktır . Muhtemelen okunması gereken bazı yüksek kavramlar:

Gizli Markov modeli . Mevcut durum göz önüne alındığında, geçmiş gelecekten bağımsızsa bir süreç Markov'dur. Hemen hemen her zaman serisi bir çeşit Markov süreci olarak modellenmiştir. Bir Gizli Markov Modeli, durumun doğrudan gözlenmediği bir modeldir (örneğin, roketinizin tam yerini asla doğrudan gözlemlemez ve bunun yerine Bayes filtresinden yerini çıkartamazsınız).
Kalman Filtresi . Bu, yaygın olarak kullanılan parçacık filtrelemeye bir alternatiftir. Temelde, her şeyin çok değişkenli Gaussian olduğu varsayıldığı bir Bayes filtresi.

— Matthew Gunn
kaynak

2

Önce kodlaması kolay durum uzay modelleri ve kapalı form filtreleme (örn. Kalman filtreleri, gizli markov modelleri) hakkında bilgi edinmelisiniz. Matthew Gunn, basit kavramlarla şaşırtıcı bir şekilde uzaklaşabileceğiniz konusunda doğrudur, ancak benim düşünceme göre, bunu bir ara hedef yapmalısınız çünkü:

1.) Nispeten konuşursak, durum uzayı modellerinde daha hareketli parçalar vardır. SSM'leri veya gizli markov modellerini öğrendiğinizde, çok fazla gösterim var. Bu, bir şeyleri doğrularken oyun belleğinizde saklanacak daha fazla şey olduğu anlamına gelir. Şahsen, önce Kalman filtreleri ve doğrusal-Gauss SSM'lerini öğrenirken, temelde "eh, hepsi sadece çok değişkenli normal vektörlerin özellikleri ..." sadece hangi matrisin hangisi olduğunu takip etmek zorundayım "diye düşünüyordum. Ayrıca, kitaplar arasında geçiş yapıyorsanız, bunlar genellikle gösterimi değiştirir.

Daha sonra bunu "eh, bu her zaman noktasında sadece Bayes'in kuralı" gibi düşündüm. Bunu bir kez düşündüğünüzde, Kalman filtresinde olduğu gibi, konjuge ailelerin neden güzel olduğunu anlıyorsunuz. Gizli bir markov modelini, ayrı durum alanı ile kodladığınızda, neden herhangi bir olasılık hesaplamak zorunda olmadığınızı görürsünüz ve filtreleme / yumuşatma kolaydır. (Sanırım burada geleneksel hmm jargonundan sapıyorum.)

2.) Bunların çoğunu kodlayarak dişlerinizi kesmek, bir durum uzay modelinin tanımının ne kadar genel olduğunu fark etmenizi sağlayacaktır. Çok yakında kullanmak istediğiniz modelleri yazacak ve aynı zamanda neden yapamayacağınızı göreceksiniz. İlk olarak sonunda alıştığınız bu iki formdan birine yazamayacağınızı göreceksiniz. Biraz daha düşündüğünüzde, Bayes kuralını yazıyorsunuz ve sorunun veri için bir çeşit olasılık hesaplayamamanız olduğunu görüyorsunuz.

Sonuç olarak, bu posterior dağılımları (durumların düzgünleştirilmesi veya filtrelenmesi) hesaplayamamakta başarısız olacaksınız. Bununla ilgilenmek için orada çok sayıda yaklaşık filtreleme malzemesi var. Partikül filtreleme bunlardan sadece bir tanesidir. Parçacık filtrelemenin ana paketi: bu dağılımları simüle edersiniz çünkü hesaplayamazsınız.

Nasıl simüle edersiniz? Çoğu algoritma, önemli örneklemenin sadece bir çeşididir. Ama burada da daha karmaşık bir hal alıyor. Doucet ve Johansen tarafından hazırlanan eğitici makaleyi tavsiye ederim ( http://www.cs.ubc.ca/~arnaud/doucet_johansen_tutorialPF.pdf ). Kapalı form filtrelemenin nasıl çalıştığını görürseniz, önem örnekleme genel fikrini, daha sonra monte carlo yönteminin genel fikrini tanıtır ve daha sonra güzel bir finansal zaman serisi örneği ile başlamak için bu iki şeyi nasıl kullanacağınızı gösterir. IMHO, partikül filtrelemeyle ilgili en iyi öğreticiyim.

Karışıma iki yeni fikir eklemeye ek olarak (önem örnekleme ve monte carlo yöntemi), şimdi daha fazla gösterim var. Bundan sonra örneklediğiniz bazı yoğunluklar; bazılarını değerlendirirsiniz ve bunları değerlendirdiğinizde örneklerle değerlendirirsiniz. Sonuç, hepsini kodladıktan sonra, ağırlıklandırılmış numuneler, parçacıklar olarak kabul edilir. Her yeni gözlemden sonra değişirler. Tüm bunları bir kerede almak çok zor olurdu. Bence bu bir süreç.

Cryptic veya handwavy olarak karşılaşırsam özür dilerim. Bu sadece konuyu kişisel olarak tanımamın zaman çizelgesidir. Matthew Gunn'un gönderisi muhtemelen daha doğrudan sorunuzu cevaplıyor. Az önce bu cevabı atacağımı düşündüm.

— Taylor
kaynak