Önem örneklemesi nedir?


Yanıtlar:


15

Önem örneklemesi, çıkar dağılımından bir parametrenin daha kolay tahminlerini daha kolay elde etmek için , ilgi dağılımından farklı bir dağıtımdan örnekleme şeklidir . Tipik olarak bu, aynı numune büyüklüğü ile doğrudan orijinal dağıtımdan örnekleme ile elde edilenden daha düşük bir varyansa sahip olan parametre tahminlerini sağlayacaktır.

Çeşitli bağlamlarda uygulanır. Genel olarak, farklı dağılımlardan örnekleme , başvuru tarafından belirlenen (önemli bölge) ilgilenilen dağılımın bir kısmında daha fazla numune alınmasına izin verir .

Bir örnek, söz konusu dağılımın sağlayacağı saf rastgele örneklemeden ziyade, dağıtımın kuyruklarından daha fazla örnek içeren bir örneğe sahip olmak isteyebilirsiniz.

Wikipedia makale bu konuda gördük çok soyut. Çeşitli özel örneklere bakmak daha iyidir. Bununla birlikte, Bayesian Networks gibi ilginç uygulamalara bağlantılar içerir .

1940'larda ve 1950'lerde önemli örneklemenin bir örneği, bir varyans azaltma tekniğidir (Monte Carlo Metodu'nun bir şeklidir). Örneğin , Hammersley ve Handscomb tarafından Monte Carlo Yöntemleri adlı kitabın 1964'te Methuen Monograf / Chapman ve Salonu olarak yayınlanan ve 1966'da ve daha sonra diğer yayıncılar tarafından yeniden basılan kitabına bakınız . Kitabın 5.4 . Kısmı , Önem Örnekleme'yi içermektedir.


2
Buna eklemek için: RL'de genel olarak politikaya örneklemeye önem veriyorsunuz: örneğin, gerçekten örneklemek istediğiniz gerçek politika yerine bir keşif politikasından eylemleri örnekleme
DaVinci

3
Bu cevap önem örneklemesi neyi açıklayarak iyi başlıyor yapar ama aslında önem örneklemesi ne sorusunu yanıtlar asla bulmak hayal kırıklığına uğradım ise : nasıl çalışır?
whuber

@whuber Buradaki amacım, kavramı karışık bir OP'ye açıklamak ve onu biraz literatüre yönlendirmekti. Bu büyük bir konudur ve görünüşte farklı uygulamalarda kullanılır. Diğerleri ayrıntıları basitçe benden daha iyi açıklayabilirler. Bir soruyu cevaplamaya karar verdiğinizde, bütün domuz ve güzel grafikler sağladığınızı, basit bir dil kullanarak teknik detayları okuduğunuzu biliyorum. Bu görevliler toplumu hemen hemen her zaman netliği ve eksiksizliği ile tatmin ediyorlar ve ben de OP’yi en azından kısmen tatmin ettiğini söylüyorum. Belki de denklemli birkaç cümle sizin önerdiğiniz gibi yeterli olacaktır.
Michael R. Chernick,

Belki de bu, toplumun sadece başka kaynaklara işaret etmek ve hatta bağlantı sağlamaktan ziyade, sorunun cevabına konması daha iyidir. Yaptığım şeyin yeterli olduğunu ve bir istatistik acemi olduğunu kabul eden OP'nin kendi başına biraz çaba sarf etmesi gerektiğini hissettim.
Michael R. Chernick,

5
Haklısın. Yine de merak ediyorum, bir veya iki cümle ile (matematik yok, grafik yok, neredeyse hiç fazla çalışma yok) sorulan soruya cevap vermenin mümkün olup olmadığını merak ediyorum. Bu durumda, tarifede beklentinin (sadece herhangi bir "parametre değil") tahmin edilmesi gerektiği vurgulanmalı , sonra beklenti değerlerin ve olasılıkların bir ürününü topladığından, olasılıkların değiştirilerek aynı sonucun elde edildiğine dikkat çekilmelidir. örneklemesi kolay olan bir dağıtım için) ve bunu telafi edecek değerleri ayarlama.
whuber

33

Önem örneklemesi, integrallere yaklaşmayı amaçlayan bir simülasyon veya Monte Carlo yöntemidir. "Örnekleme" terimi, belli bir dağıtımdan örnekler sağlama niyetinde olmadığı için kafa karıştırıcıdır.

Önem örneklemesinin ardındaki sezgi , gibi iyi tanımlanmış bir integralin geniş bir aralık için bir beklenti olarak ifade edilebileceğidir. olasılık dağılımları: burada yoğunluğu ifade eder olasılık dağılımının ve ve ile belirlenmesi . (Not bu genellikle farklıdır ). Gerçekten de, tercih için yol açar eşitlikler veI = E f [ H ( X ) ] = X H ( x ) f ( x )

I=Xh(x)dx
f H h f H ( ) h ( ) H ( x ) = h ( x )
I=Ef[H(X)]=XH(x)f(x)dx
fHhfH()h() 'H(x)f(x)=h(x)ı=ef[' H(x)]-ff(x)>0h(x)0-f
H(x)=h(x)f(x)
H(x)f(x)=h(x)I=Ef[H(X)] desteği üzerindeki bazı kısıtlamalar altında , olduğunda anlamına gelir . Bu nedenle, W. Huber'in yorumunda işaret ettiği gibi, bir integralin bir beklenti olarak temsil edilmesinde bir teklik yoktur, ancak bunun karşısında, bazıları karşılaştırmak için bir zamanlar diğerlerinden daha iyi olan bu tür temsillerin sınırsız bir dizisi vardır. onlar kabul edildi. Örneğin, Michael Chernick , tahmin edicinin varyansını azaltmaya yönelik seçiminden bahseder .ff(x)>0h(x)0f

Bu temel özellik anlaşıldıktan sonra, fikrin uygulanması diğer Monte Carlo yöntemlerinde olduğu gibi Büyük Sayılar Yasasına dayanmak, yani [sözde rasgele bir üretici aracılığıyla] bir iid örneği x_n) taklit etmektir. dağıtılmış ve yaklaşım kullanımı kif ı = 1(x1,,xn)f

I^=1ni=1nH(xi)
  1. yansız bir tahmincisiI
  2. neredeyse kesinlikle ben yakınsakI

Dağıtım seçimine bağlı olarak , yukarıda tahmincisi ben ya sonlu varyans olabilir veya olmayabilir. Ancak, her zaman sınırlı bir varyansa ve hatta keyfi bir şekilde küçük bir varyansa izin veren f seçenekleri vardır (bu seçimler pratikte kullanılamayabilir). Ve ayrıca kümesi var f önem örneklemesi tahmincisi yapmak I çok kötü bir yaklaşım I . Bu, Chatterjee ve Diaconis tarafından yayınlanan bir makalenin önemsiz örnekleyicileri sonsuz varyansla nasıl karşılaştırdığını araştırmasına rağmen, varyansın sonsuzlaştığı tüm seçenekleri içerir . Aşağıdaki resimfI^ffI^Ibloguma tartışma ait kağıt ve sonsuz varyans tahminleri zayıf yakınlaşma gösterir.

Önem dağılımı ile önem örneklemesi, bir Exp (1) dağıtım hedefi dağılımı, bir Exp (1/10) dağılımı ve ilgi fonksiyonu $ h (x) = x $.  İntegralin gerçek değeri 10 $ 'dır.

Önem dağılımı ile önem örneklemesi, bir Exp (1) dağıtım hedefi dağılımı, bir Exp (1/10) dağılımı ve ilgi fonksiyonu . İntegralin gerçek değeri 10'dur .h(x)=x10

[Aşağıdakiler, Monte Carlo İstatistiksel Yöntemler kitabımızdan üretilmiştir .]

Ripley'den (1987) gelen aşağıdaki örnek, X h ( x ) f ( x ) integralinde görünen (orijinal) dağılımından başka bir dağıtımdan elde etmenin neden ödediğini gösteriyor.f ilgilenilen bir başka deyişle, bir integralin belirli bir yoğunluğa karşı bir beklenti olarak temsil edilmesini değiştirmek için.

Xh(x)f(x)dx

Örnek (Cauchy kuyruk olasılık) ilgi konusu miktar olasılığı olduğunu varsayalım , bu Cauchy değişken daha büyük olan olduğu, Tüm deneysel ortalama üzerinden değerlendirilir iid örnek bir , bu tahmin edicinin varyansı ( bu yana eşittir ).p2p=+ 2C(0,1)2p p 1 = 1

p=2+1π(1+x2)dx.
p X 1 ,, X m
p^1=1mj=1mIXj>2
X1,,Xm p ( 1 - p ) / m 0.127 / m p = 0.15C(0,1)p(1p)/m0.127/mp=0.15

Bu değişkenlik, in simetrik niteliği dikkate alınarak azaltılabilir , çünkü , , eşittir .C(0,1)

p^2=12mj=1mI|Xj|>2
p(12p)/2m0.052/m

Bu yöntemlerin (göreceli) verimsizliği, bir anlamda, yaklaşımıyla ilgili olmayan, ilgilenilen alan dışındaki değerlerin oluşmasından kaynaklanmaktadır . [Bu, kuyruk alanı tahmininden bahseden Michael Chernick ile ilgilidir.] Eğer , , yukarıdaki integralin beklentisi olduğu kabul edilebilir , burada . Bu nedenle , için alternatif bir değerlendirme yöntemi için[2,+)pp

p=12021π(1+x2)dx,
h(X)=2/π(1+X2)XU[0,2]p
p^3=121mj=1mh(Uj)
UjU[0,2]. Varyansı olan ve eşit olduğu parça gösterileri bir entegrasyon . Üstelik, , bu integral ayrıca in beklentisi olarak da görülebilir üniform dağılımı karşı ve bir başka değerlendirme olan , . Parçalarla aynı entegrasyon, varyansının göstermektedirp^3(E[h2]E[h]2)/m0.0285/mp
p=01/2y2π(1+y2)dy,
14h(Y)=1/2π(1+Y2)[0,1/2]p
p^4=14mj=1mh(Yj)
YjU[0,1/2]p^4o zaman .0.95104/m

İle karşılaştırıldığında , getirdiği varyans azalma düzeyindedir bu değerlendirme gerektiren, özellikle de, anlaşılacağı, Aynı hassasiyeti elde etmek için kat daha az simülasyon . p 410-3p^1p^4103 p 1100032p^1


5
Teşekkürler @ Xi 'a, herkesin takdir edebileceği bir şekilde örneklemenin önemini örnekleme sorununa gittiğin için ve Bill Huber'in isteğini yerine getirmekten daha fazlasını düşünüyorum. +1
Michael R. Chernick,

2
Başlangıçta bu gönderinin beklemeye alındığını ve birkaç kişinin katkılarından dolayı teşekkür etmek istiyorum. Bilgilendirici bir konu ile geldik.
Michael R. Chernick,

5
Christian, teşekkürlerimi iletmek ve aktif bir şekilde bu tür mükemmel malzemeleri bizimle paylaştığınız bir ayrıcalık duygusunu ifade etmek istiyorum.
whuber

4
Ben sadece bir tanesini vermesine rağmen, cevabımı geliştirmek için birkaç düzenleme yapacak kadar nazik olan Xi'an'a teşekkür etmek istiyorum.
Michael R. Chernick

3
Bu, istatistik.stackexchange'teki en iyi yayınlardan biri olmalı. Paylaşım için teşekkürler!
dohmatob
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.