Uygunsuz Karışımlardan Kesin Örnekleme


10

Varsayalım sürekli dağılımından örnek almak istiyorum . Formda ifadesi varsapp(x)p

p(x)=i=1aifi(x)

burada ve f_i kolayca örneklenebilen dağılımlardır, o zaman kolayca p ile örnekleri oluşturabilirim :ai0,iai=1fip

  1. A_i olasılığı olan bir i etiketini örneklemeiai
  2. Örnekleme Xfi

ai ara sıra negatifse bu prosedürü genelleştirmek mümkün müdür ? Bunun bir yerde yapıldığını sanıyorum - muhtemelen bir kitapta, muhtemelen Kolmogorov dağılımı için - bu yüzden bir referansı cevap olarak kabul etmekten mutluluk duyacağım.

Somut bir oyuncak örneği yardımcı olursa, diyelim ki

p(x,y)exp(xyαxy)x,y>0
istiyorum şeylerin büyük şemasında çok önemli olmaması gereken teknik nedenlerle \ alpha \ in (0, 2) alınız α(0,2).

Prensip olarak, bunu aşağıdaki toplam olarak genişletebilirim:

p(x,y)n=0(1)nαn(n2)!(n2)!n!(xn/2ex(n2)!)(yn/2ey(n2)!).

(x,y) toplamı daha sonra bağımsız bir şekilde, Gama rastgele dağılımı özellikleri olarak örneklenen olabilir içinde -terms. Benim sorunum açıkça katsayıların "nadiren" negatif olduğudur.

Düzenleme 1 : Ben oluşturmak isteyen hemen belirteyim tam örneklerini gelen p yerine altına beklentilerini hesaplayarak yerine, p . İlgilenenler için, bunu yapmak için bazı prosedürler yorumlarda belirtilmiştir.

Edit 2 : Devroye'nin 'Düzgün Olmayan Rastgele Değişken Üretimi'nde bu soruna özel bir yaklaşım içeren referansı buldum . Algoritma, Bignami ve de Matteis'in 'Dağıtım Kombinasyonlarından Örnekleme Üzerine Bir Not' dan alınmıştır . Yöntem, yoğunluğu, toplamın pozitif terimleriyle yukarıdan etkili bir şekilde bağlamak ve daha sonra bu zarfı temel alan reddetme örneklemesi kullanmaktır. Bu, @ Xi'an'ın cevabında açıklanan yönteme karşılık gelir.


1
Neden sadece mutlak değerini kullanarak örnek olamaz sizin olumsuzlayarak sonra ve numuneyi? Başka bir deyişle tanımlayın(sonlu olduğu varsayılarak) ve ardından toplamı ile yeniden normalleştirin . aiXfiZ:=i=1|ai|Z
Alex R.

2
@AlexR. Seni anlarsam, bunun bir versiyonu altındaki beklentileri hesaplamak için pratik olur , ancak yine de kesin örnekler almak için uygun değildir . Kesinlikle bu, aradığım şey olmasa da, ilgili bir sorunun cevabı. pp
8r8

4
Bu örnekle ne yapmak istediğinize bağlıdır. Örneğin, momentleri hesaplamak amacıyla, negatif katsayısı olan bir bileşenden seçilen herhangi bir noktayı "negatif" nokta olarak işaretleyerek ve katkısını moment tahmininde negatif olarak ağırlıklandırarak, örneklemelerin yoğunluk karışımlarından genelleştirilmesi açıktır. Benzer şekilde, bazı değerlerinin negatif olma olasılığını kabul edebilmeniz koşuluyla, bu tür negatif ağırlıklara sahip bir KDE oluşturabilirsiniz! (cc @ Xi'an)
whuber

1
Bir dağıtımın "kesin" örneği ne olurdu? Yine, negatif ağırlığa sahip bir karışımdan yararlanıp yararlanamayacağınız ve nasıl kullanabileceğiniz, örneği nasıl kullanmayı planladığınıza bağlıdır.
whuber

1
Bu, sorunuza cevap vermiyor, ancak günlük olasılık istatistiklerinden
Tim

Yanıtlar:


5

Bu soruya şaşırdım ama tatmin edici bir çözümle gelmedim.

Olası bir özellik, eğer bir yoğunluk , burada bir yoğunluk , simulasyon ve bu simülasyonları olasılığı ile reddetme simülasyonlar sağlar . Mevcut durumda, pozitif ağırlık bileşenlerinin normalleştirilmiş halidir ve geri kalan bölümüdür;

f(x)=g(x)ωh(x)1ωω>0
gg(x)ωh(x)gωh(x)/g(x)fg
g(x)=αi>0αifi(x)/αi>0αi
ωh
h(x)=αi<0αifi(x)/αi<0αi
Bu aslında Devroye, Düzgün olmayan rasgele değişken üretimi , Bölüm II.7.4'ün simülasyon incisinde bulunur, ancak basit bir kabul-reddetme muhakemesinden kaynaklanır.

Bu yaklaşımın bir birinci hesaplama dezavantajı, seçilen bir bileşen ilk taklit rağmen, yani , hem de toplamları ve reddi adımı için hesaplanmalıdır. Toplamlar kapalı form sürümü olmayan sonsuzsa, bu kabul-reddetme yönteminin uygulanmasını imkansız hale getirir .figh

İkinci bir zorluk, her iki ağırlık aynı sıraya sahip olması nedeniyle ret oranıüst sınırı yoktur. Aslında ile ilişkili seriler tam olarak yakınsak değilse, kabul olasılığı sıfırdır! Ve yöntem bu durumda uygulanamaz.

αi>0αi=1αi<0αi
1ϱaccept=αi<0|αi|/i|αi|
αi

Eğer bir karışım temsil durumunda, olarak yazılabilir önce bileşen seçildikten sonra bileşene uygulanan yöntem seçilebilir. Ancak bu , olası sonsuz toplamdan uyan çiftleri tanımlamak için hassas olabilir .f

f(x)=i=1αigi(x)ωih(xi)1ωiωi>0
(gi,hi)gi(x)ωih(xi)>0

Bence seri gösterimin kendisinden daha verimli bir çözüm gelebilir. Devroye, Düzgün olmayan rasgele değişken üretimi , Bölüm IV.5, çok çeşitli seri yöntemleri içerir. Örneğin, ' olduğunda hedefinin alternatif seri gösterimi için aşağıdaki algoritma s ile sıfıra ve bir yoğunluktur:

f(x)=κh(x){1a1(x)+a2(x)}
ai(x)nhDevroye'nin alternatif seri yöntemi

Sorun, son zamanlarda, örneğin Glynn-Rhee yaklaşımında olduğu gibi, MCMC için önyargılı öngörü tahminleri bağlamında ele alınmıştır . Ve Rus rulet tahmincisi (Bernoulli fabrika problemiyle bağlantılı). Ve tarafsız MCMC metodolojisi . Ancak işaret sorunundan kaçış yok ... Bu, sahte marjinal yöntemlerde olduğu gibi yoğunlukları tahmin ederken kullanımını zorlaştırıyor.

Ayrıca düşünme üzerine, benim çıkarılacak sonuç şudur: gerçek bir simülasyon üretmek için hiçbir jenerik yöntem olmasıdır serisi [ziyade karışıma yanlış kullanılan bir terim olarak çıkıyor] bir gibi, serinin elemanlarına> ayrıca yapı empoze olmadan, Devroye İncilinden yukarıdaki algoritma . Gerçekten de, (?) Yoğunlukların çoğu yukarıdaki türün bir seri genişlemesine izin verdiğinden, bu aksi takdirde bir tür evrensel simülasyon makinesinin varlığını ima eder ...


Teşekkür ederim! Ek referansları da takdir ediyorum.
8r8

1
Çok kapsamlı yanıt ve referanslar için ek teşekkürler. Bu cevabı sonlu zamanda kesin örnekler üretmeyi başardığı için kabul ediyorum . Sorun hakkında bir ölçüde düşünmeye devam edeceğim; ümit verici görünen tek ek fikir, 'den örneklemeyi , koşullu olarak olarak görmek ve bazı geometrik olabilir. Bu karakterizasyon için yararlı olan kavrayış ( üzerinde bir dilim örnekleyicisi gibi düşünüyorum ). Şerefe! pp=λgμhXgλgμh{(x,y):μh(x)<y<λg(x)}
8r8

1
Koşullu örnekleyiciyi oldukça kötü açıkladım; set tabanlı karakterizasyon biraz daha açıktır (bence). Benim en önemli noktam , son satırdaki iki boyutlu kümeden eşit olarak örnekleyebiliyorsanız , koordinatının doğru dağılıma sahip olduğu sonucudur. Bu karakterizasyonun daha uzun toplam esaslı uygun olmayan karışımlar için faydalı olup olmayacağı hala görülüyor. (x,y)x
8r8

1
Ben de bir dilim örnekleyici düşünüyordum, ama bu simülasyon anlamında "kesin" değil.
Xi'an

1

İşe yarayacak bir fikir taslağı var. Öyle kesin değil ama umarım asimptotik kesin. Yaklaşmanın kontrol edildiği veya bununla ilgili bir şeyin kanıtlanabileceği gerçekten titiz bir yönteme dönüştürmek için muhtemelen çok fazla iş gerekir.

İlk olarak, Xi'an'ın belirttiği gibi, bir yandan pozitif ağırlıkları ve diğer yandan negatif ağırlıkları gruplayabilirsiniz, böylece nihayetinde sorunun sadece iki ve dağılımı vardır :gh

p=λgμh

ile . olduğunu unutmayın .λμ=1λ1

Benim fikrim şudur. Örnek gözlemlerini . Yapmak:Np

  • değerlerini örnekleyin ve bir listede saklayınλNg
  • örneklenen değerlerinin her biri için , en yakın (kalan) komşularını listeden kaldırın.μNh

Sonunda puanı alırsınız . Tam olarak en yakın komşu olmak zorunda değil , sadece "yeterince yakın" bir nokta. İlk adım madde üretmek gibidir. İkinci adım antimadde üretmeye benzer ve madde ile çarpışmasına ve iptal olmasına izin verir. Bu yöntem kesin değildir, ancak bazı koşullar altında büyük için asimptotik olarak kesin olduğuna inanıyorum (küçük için neredeyse kesin hale getirmek için önce büyük bir kullanmanız ve daha sonra son listenin küçük bir rastgele bölümünü almanız gerekir ) . Kanıttan çok bir açıklama olan gayri resmi bir argüman veriyorum.(λμ)N=NNnN

Düşünün gözlem alanı ve küçük hacmi çevresinde Lebesgue hacmi ile . Numune sonra de yer alır listesinde elemanların sayısı olduğu takribi . İkinci adımdan sonra, yaklaşık olarak ondan kaldırılacak ve yaklaşık olarak istenen sayısına sahip olacaksınız . Bunun için hacimdeki nokta sayısının yeterince büyük olduğunu varsaymanız gerekir.xvxϵgvλNg(x)ϵμNh(x)ϵNp(x)ϵ

Bu yöntemin büyük boyuta veya ve bazı patolojilerine direnmesi pek olası değildir, ancak küçük boyutta çalışabilir ve yeterince düzgün, "yeterince homojen" dağılımlar gösterebilir.gh

Kesin bir yöntem hakkında not:

Bunu ilk önce kesikli dağılımlar için düşündüm ve açıkça bu durumda yöntem kesin değildir, çünkü 0 olasılığı olan numuneler üretebilir. Sonlu işlem süresinde kesin bir yöntemin mümkün olmadığı ve bunun en azından ayrık dağılımlar için imkansızlık kanıtlanabilir. Oyunun kuralı, yalnızca ve için tam olarak "oracle" örnekleyicileri kullanmanıza izin verilmesidir, ancak ve işlevleri olarak bilmezsiniz . Basitlik için Bernoulli dağılımlarıyla sınırlandırın. Tam bir yöntemin olmayan varlığı ile ilgilidir Bernoulli Fabrika teori: Bir oluşturabilir, bir mesafede -coinghghx(λpμq)p-coin ve -coin, o zaman için imkansız olduğu bilinen bir -coin'den bir -coin yaratabilirsiniz .qλppλ>1


1
Bunu düşündüm ama reddettim çünkü işe yarayacağını göstermek için ilk çabalarım, en iyi ihtimalle bir tahmin ve potansiyel olarak fakir olacağının farkına varmasına yol açtı. Evet, asimptotik olarak işe yarayabilir, ancak OP'nin dağıtımdan "tam" örnekleme talebini karşılamaz.
whuber

Bu yöntemin etkinliği, kesin kabul etme-reddetme yöntemiyle tam olarak aynıdır.
Xi'an

1
Kabul. Yine de oldukça farklılar. Kabul et reddetme yönteminin ve değerlerini işlevleri olarak hesaplaması gerekir . Sadece ve örneklemeyi gerçek bir karışımda olduğu gibi "oracle" örnekleyicileri olarak kullanmaya odaklandım . Ne kadar çok düşünürsem, örnekleme kehanetlerine dayanan kesin bir yöntemin olamayacağına ikna oldum. ghxgh
Benoit Sanchez

1
Bunun genel olarak doğru olduğunu, ancak böyle kesin bir yöntem özel durumlarda yararlı sınıfları olabilir yapar mevcuttur. Yani en bazı durumlarda (1) hesaplanması nedeniyle kolaydır ve (2) her iki hesaplamak gerekmez ve bu oran hesaplamak --Yeni yeterlidir. g/(g+h)gh
whuber

@BenoitSanchez Ayrıntılı yanıtınız için teşekkür ederiz; Sonunda kesinliğin (potansiyel) imkansızlığı hakkındaki yorumları özellikle takdir ediyorum. Geçmişte Bernoulli Fabrikalarına rastladım ve onları oldukça zor buldum; Konuyu tekrar gözden geçirmeye çalışacağım ve herhangi bir görüş sağlayıp sağlamadığını göreceğim.
8r8
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.