Numune alamadığımız tek değişkenli dağıtım var mı?


12

Tek değişkenli dağılımlardan (ters dönüşüm, kabul-reddet, Metropolis-Hastings vb.) Rastgele üretim için çok çeşitli yöntemlere sahibiz ve tam anlamıyla herhangi bir geçerli dağıtımdan örnek alabileceğimiz anlaşılıyor - bu doğru mu?

Rastgele üretilmesi imkansız olan tek değişkenli dağıtım örneği verebilir misiniz? Sanırım imkansız olduğu yerde mevcut değil (?), Bu yüzden diyelim ki "imkansız" ile aynı zamanda çok hesaplı olarak pahalı, örneğin sadece bir kabul etmek için büyük miktarlarda örnek çekme gibi kaba kuvvet simülasyonları gerektiren durumlar bunlardan birkaçı.

Böyle bir örnek mevcut değilse, herhangi bir geçerli dağıtımdan rastgele çekiliş yapabileceğimizi kanıtlayabilir miyiz ? Bunun için karşı örnek olup olmadığını merak ediyorum.


6
Gerçekten de "imkansız / imkansız" demekle kastettiğinize geliyor. Örneğin, cdf ve pdf'nin değerlendirilmesinin çok pahalı olduğu durumlar vardır, bu da çoğu yöntemi engelleyici hale getirir ve pdf üzerinde iyi zarf sınırlarının bulunduğu dağıtım şekilleri bulmak zor değildir (kabul etmeyi reddetmek için çoğunlukla fonksiyon değerlendirmesinden kaçınıyor) mevcut değildir. Bu nedenle, zaten hariç tuttuğunuz durumda başarısız olur ve kabul etmek reddetme kullanmaktan ( F
cdf'nin

3
Bir bilgisayar kullanarak (0,1) aralığındaki irrasyonel sayılar kümesinden düzgün rastgele örnekler çizemiyoruz. İspat, okuyucu için bir egzersiz olarak bırakılmıştır.
Cliff AB

2
@Cliff AB Bu aralık aritmetiği ile yapılabilir. Her bilgisayar değerlendirilebilir (rasyonel) noktası etrafında [0,1] 'in tamamı bu aralıklar kapsamında olacak şekilde bir (en küçük) aralık tanımlayın. Çizilebilen her bir "tekdüze" bilgisayar için, bu aralık bağımsız değişkenindeki kümülatif dağılım işlevinin tersi aralığını (dışa yuvarlama ile) değerlendirin. Bu, rastgele numunenin aralıklı bir örneğini üretecektir,% 100 gerçek numuneyi içereceği garanti edilmektedir.
Mark L. Stone

2
Ben zaten yeterince verimsiz kabul reddi "imkansız" olarak saymak beri, ne olduğunu bildiğiniz diğer yaklaşım daha kötü (daha fazla hesaplama gerektirir) yeterince pahalı yaparsanız, muhtemelen bu "imkansız" olarak kabul ediyorum. Değerlendirilmesi pahalı olan F ve
f'leri inşa

1
ctd ... (ama toplu olarak, insanlar oldukça ustaca, bu yüzden sorunun birçoğunu çözen güzel bir fikir bulursanız, bir gün çok zor görünen şey mümkün olabilir). "Böyle ve böyle bir doğruluğa yaklaşmak iyidir" dersek, bu zorlukların birçoğu birçok durumda ortaya çıkabilir (örneğin, biri büyük arama tabloları / histogramdan nesil oluşturabilir, örneğin, çoğu zaman oldukça hızlı yaklaşık değerler üretiyorsunuz).
Glen_b

Yanıtlar:


15

Kümülatif dağılım işlevini biliyorsanız, analitik veya sayısal olarak tersine çevirebilir ve ters dönüşüm örnekleme yöntemini kullanarak rastgele örnekler https://en.wikipedia.org/wiki/Inverse_transform_sampling oluşturabilirsiniz .F(x)

tanımlayın . Bu, sürekli, ayrık veya herhangi bir kombinasyon olsun, tüm dağıtımları idare edecektir. Bu her zaman sayısal olarak ve belki de analitik olarak çözülebilir. U, Tekdüzen [0,1] olarak dağıtılan rasgele bir değişkenden, yani tekdüze [0,1] rasgele sayı üretecinden bir örnek olsun. Daha sonra , yukarıda tanımlandığı gibi , dağılımına sahip rastgele bir değişkenin rastgele örneğidir . F - 1 ( U ) F ( x )F-1(y)=bennf(x:F(x)y)F-1(U)F(x)

Bu rastgele örnekler üretmenin en hızlı yolu olmayabilir, ancak F (x) 'in bilindiği varsayılan bir yoldur.

F (x) bilinmiyorsa, bu farklı bir hikaye.


2
Eğer bilinmemektedir, daha sonra alakalı olduğunu Açıkçası? Ne bilinir. Bir şey bilmiyorsanız, bir şey yapmanız mümkün olmayacaktır. Eğer bir şey biliyorsanız, o zaman o şey ne olduğuna bağlıdır.F(x
Mark L. Stone

@Tim Aslında, F (X) bilmediğimiz oldukça yaygındır, ancak ondan örnekler üretebiliriz. Monte Carlo (stokastik) simülasyonunda tipik bir senaryo budur.
Mark L. Stone

@Tim: Bu hikaye ile ilgilenmiyorsanız, hangi hikayeyle ilgilendiğiniz açık değildir. Glen_b'in yorumuna yanıt olarak, verimsiz örnekleme ile ilgilenmediğinizi söylediniz. Bu yöntem, verimsiz olsa da, herhangi bir pdf'den örneklemenize izin verecektir (sayısal entegrasyonun başarısız olduğu o kadar kötü davranmadığı varsayılarak, ancak kimsenin bu dağıtımları kullanmayı önemsediğini düşünmüyorum). Yani, sonsuz sayıda yerde süreksiz olan dağılımlarla ilgilenmiyorsanız, sorunuzun cevabı bu olmalıdır: evet yapabiliriz.
Cliff AB

Aslında, biliniyor ancak F - 1 değilse , bu bir sorundur. FF1
Xi'an

1
Sorunla ne demek istediğine bağlı. Eğer bilinir ardından cevabım başına F - 1 ( y ) = i , n f ( x : F ( x ) y ) her zaman iyi tanımlanmış olan ve sayısal olarak çözülebilir. İstediğiniz kadar hızlı olmayabilir, bu yüzden sorunla demek istediğiniz buysa, tamam Eğer demek istediğiniz bu değilse, sorun nedir? FF-1(y)=bennf(x:F(x)y)
Mark L. Stone

7

Bir dağılım sadece moment üreten fonksiyonu veya karakteristik fonksiyonu Φ ( t ) = E [ exp { i t X } ] ile tanımlandığında , yol bulmak nadirdir bu dağılımlardan üretme.φ(t)=E[tecrübe{tX}]Φ(t)=E[tecrübe{bentX}]

İlgili bir örnek, yoğunluk veya cdf için bilinen bir forma sahip olmayan, moment üreten fonksiyona sahip olmayan, ancak kapalı bir form karakteristik fonksiyonuna sahip olan kararlı dağılımlardanα yapılır .

Bayesci istatistiklerde, inatçı olabilirliklerle veya sadece bir bilgisayara sığmayacak kadar büyük veri kümeleriyle ilişkili posterior dağılımların simüle edilmesi (tam olarak) imkansız olarak görülebilir.


Sadece moment üretme işlevini biliyorsanız, sele noktası yaklaşık değerini kullanabilir ve bundan sonra simüle edebilirsiniz.
kjetil b halvorsen

1
@ Xi'an "Verimli" kelimesini dışarıda bıraktınız. En kötü durumda, dönüşümün sayısal tersini sayısal olarak ters çevirebilirsiniz. Bu işi yapacak, belki "verimli" değil, ama yapacak.
Mark L. Stone

3
@kjetilbhalvorsen: eyer noktası yaklaşımı, koyduğum bağlantıda önerilen çözümdür. Ama bu bir yaklaşım!
Xi'an

2

Sürekli dağılımlara atıfta bulunduğunuzu varsayarsak. Olasılık integrali dönüşümünü kullanarak, u ( 0 , 1 ) simülasyonunu yapıp F - 1 ( u ) alarak herhangi bir tek değişkenli dağıtımdan benzetim yapabilirsiniz . Böylece, bir üniforma taklit edebiliriz, o zaman bu kısım yapılır. F'den simülasyonu engelleyebilecek tek şey , ters F - 1'i hesaplayamamanızdır , ancak bu teorik bir şeyden ziyade hesaplama zorluklarıyla ilgili olmalıdır.Fu~(0,1)F1(u)FF1


1

Şimdi soru, sadece bir ile herhangi bir model almak "dan numuneye zor" dönüştüğünü iddia inatçı olasılığı , modele bir önceki dağılımını atamak parametreler ve ilgi olduğunu varsayalım θ j girdilerinden birinin marjinal posterior dağılımında . Bu, olasılığın sürdürülemezliği nedeniyle inatçı olmayan posteriordan örneklemeniz gerektiğini ima eder.θ=(θ1,...,θd)θj

Bazı durumlarda bu posteriordan yaklaşık olarak örnekleme yöntemleri vardır, ancak şu anda kesin bir genel yöntem yoktur.


... fakat soru tek değişkenli dağılımlarla ilgili. MCMC'nin çok sayıda yinelemeden sonra bile birleşmediği birçok karmaşık model örneği vardır.
Tim

@Tim Ve tam da bu yüzden marjinal posterior dedim , yani tek değişkenli ... Bana öyle geliyor ki, ne istediğini net olarak bilmiyorsun. İlk iki cevap açıktır ki teorik olarak, bildiğiniz herhangi bir dağılımdan örnekleme yapmak mümkündür.
Noah

1
OP'nin ne istediğini netleştirene kadar bu soruyu [ON HOLD] 'a koymaya ve cevapları uygulanamaz hale getirmek için her yeni cevap göründüğünde soruyu değiştirmeyi bırakmaya oy veriyorum.
Noah

Ben am değil sorumu da koşullu dağılım açısından bildirilmiş beri ... öncesinde Açıkçası istatistiksel olasılık model ve tek değişkenli değil "yeni bir cevap görünür her zaman" Değişen. Posteriordan örnek alırsanız tek değişken, ama sonra sanırım marjinal dağılıma sahip olduğumuzu varsayıyorsunuz, bu yüzden inatçı posteriorda bir sorun yok.
Tim

1
Bu iki kavramın bağlantısı olmadığında marjinali tek değişkenli ile karıştırırsınız . Tek değişkenli rasgele değişkenin olduğu anlamına gelirken, marjinal anlamına gelir dağılım başka bir yoğunluğa karşı bir integral olarak gösterilebilir. Aslında, bu integral gösterimin kullanılması, tek değişkenli bir rv'nin önce çok değişkenli bir rv simülasyonu ile simüle edilebileceği anlamına gelir. R,
Xi'an

1

Bu gerçekten bir cevap olup olmadığından emin değilim ... tahmin ediyorum (ama bilmiyorum) bir sadece sonlu katkı dağıtımından örnek olamaz. Bir örnek rasyonel sayılar üzerinde, sadece sonlu bir katkı maddesi dağılımı olarak var olabilen eşit dağılımdır. Bunu görmek için, gerekçelerinin bir numaralandırması olsun. Dağılım tekdüze olduğundan, herhangi bir i için P ( X = q i ) = 0 , bu yüzden i = 1 P ( X = q i )(qi)i=1P(X=qi)=0i fakat P ( X Q ) = 1 .i=1P(X=qi)=0P(XQ)=1

μπ(μ)=1


0

Rastgele üretilmesi imkansız olan tek değişkenli dağıtım örneği verebilir misiniz?

cc

Yalnızca değerleri 64 bit kayan noktalı sayılarla makul olarak tahmin edilebilecek rastgele değişkenleri örneklemekle ilgileniyorsanız veya değerdeki sonlu hataya benzer bir toleransınız varsa ve örneklerinizi temsil etmiyorsunuz. , bunu düşün:

X~Ber(p)p=1-c01

0(-,c)1[c,)0(-,0)c[0,1)1[1,)cxy-Axis. Hangi örnekleme zorlaştırır emin değilim, bu yüzden en çok ;-) gibi (dis) birini seçin

diyelim ki "imkansız" ile çok hesaplamalı pahalı, yani bunlardan sadece birkaçını kabul etmek için büyük miktarlarda numune çekmek gibi kaba kuvvet simülasyonları gerektiren durumlar kastediyoruz.

Bu durumda, açık cevap açık görünüyor:

  • nn
  • Bir kriptografik karma fonksiyonunun ön görüntülerini örnekleyin (yani bitcoin üretin ve git ve mercurial'ı kırın).
  • Optimal Go stratejileri setini örnekleyin (anladığım kadarıyla tüm oyunları sonlu hale getiren Çin superko kuralları ile).

Biraz daha resmi olarak: Size NP-komple probleminin (veya EXP-complete vb.) Büyük bir örneğini veriyorum ve çözüm kümesini benim için eşit olarak örneklemenizi rica ediyorum.

R,-1

Herhangi bir doğruluk atamasının SAT örneğimi karşılayıp karşılamadığını kolayca kontrol edebilir ve herhangi birinin yaptığını bildiğiniz her şeyi kontrol ettikten sonra, size karşılık gelen dağıtımı örneklemek için henüz bir boolean formül (veya devre) vererek bir CDF belirledim. aslında en azından bir SAT-çözünebilirlik kehaneti kadar güçlü bir şey olmalısınız.


Böylece size dişlilerinize kum atması gereken hesaplanamayan bir sayı verdim ve hesaplaması yavaş olan bir CDF verdim. Belki sorulması gereken bir sonraki soru şu şekildedir: Verimli bir biçimde temsil edilen bir CDF var mı (örneğin polinom zamanında değerlendirilebilir), bu dağılımla numune üretmek zor olacak mı? Bunun cevabını bilmiyorum. Bunun cevabını bilmiyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.