Latin Hiperküp Örnekleme Asimtotikleri


11

Üzerinde çalıştığım bir sorun için bir kanıt oluşturmaya çalışıyorum ve yaptığım varsayımlardan biri, örnek aldığım noktaların tüm alan üzerinde yoğun olması. Pratik olarak, tüm örnek alanı üzerinde puanlarımı elde etmek için Latin hiper küp örnekleme kullanıyorum. Latince hiperküp örnekleri size örnek büyüklüğü eğilimindedir izin verirseniz tüm alan üzerinde yoğun olursa ne bilmesi istiyorum olduğunu ? Eğer öyleyse, bu gerçek için bir alıntı çok takdir edilecektir.


4
Evet, sürekli bir dağıtım varsayarak, herhangi bir ϵ>0 için bölüm sayısını, değişken başına tüm aralıkların genişliği olacak şekilde ayarlayabilirsiniz <ϵ/2. Bu nedenle en az bir hyperinterval (örneğin, numune hacmi) sıkı bir genişlik tarafından bulunan ϵ istediğiniz herhangi bir nokta etrafında hiperküp. (Yorum, Cevap değil, LHS hakkında bildiğim her şey on dakika önce Wikipedia'dan geliyor ...)
Creosote

Bu doğrudur, ancak büyük Latin Hiperküp örneklerinin yoğunluğunu göstermek için kolayca kullanılabileceğini düşünmüyorum. Bunun nedeni, LHS'deki örneklenen noktaların bağımsız olmamasıdır: belirli bir hiperinterval içindeki bir numune noktasının varlığı, diğer herhangi bir numune noktasının aynı satırda / sütunda görünmesini (veya bunun için çok boyutlu terim ne olursa olsun) engeller. .
S.Catterall Monica'yı Geri

@ Creosote Cevabınızı daha fazla resmileştirebileceğinizi düşünüyor musunuz?

@RustyStatistician, lütfen açılış postanızı, kanıtınızın gerektirdiği gibi resmi bir şekilde, "örnek aldığım noktalar kümesi tüm alan üzerinde yoğundur" ile ne demek istediğinizi açıklamak için genişletin. Teşekkürler.
Creosote

çok büyük olduğu bir başlangıç ​​Latin Hiperküp Örneği alırsam, bunun inifinty olduğunu düşünürüz, bu örnek yoğun mu? ' n

Yanıtlar:


6

Kısa cevap: Evet, olasılıkla. Bu, herhangi bir mesafe verilen, göstermek mümkündür , herhangi bir sonlu bir alt kümesi { x 1 , ... , x m } örnek alanı ve bir öngörülmüş 'tolerans' δ > 0 uygun bir şekilde büyük numune boyutları için, emin olabilir ki bir numune, bir mesafe içinde nokta olduğunu olasılık £ değerinin bir x i olan > 1 - δ tüm i = 1 , ... , m .ϵ>0{x1,,xm}δ>0ϵxi>1δi=1,,m

Uzun cevap: Doğrudan alakalı atıfların farkında değilim (ama aşağıya bakınız). Latin Hiperküp Örneklemesi (LHS) hakkındaki literatürün çoğu varyans azaltma özellikleri ile ilgilidir. Diğer bir konu, ne örnek büyüklüğü eğiliminde olduğunu söylemek demek olduğunu ? Basit bir IID rasgele örnekleme için, boyut örnek bir n büyüklükteki bir örnek elde edilebilir , n - 1 diğer bir bağımsız örneği ekleyerek. LHS için, numune sayısı prosedürün bir parçası olarak önceden belirtildiği için bunu yapabileceğinizi sanmıyorum. Yani bir arkaya almak zorunda olacağını görünen bağımsız boyutta LHS örneklerinde 1 , 2 , 3 , . .nn1.1,2,3,...

Örnek büyüklüğü ∞'a , sınırda 'yoğun' yorumlamanın bir yolu da olmalıdır . Yoğunluk iki boyutta, sen boyutta LHS örneklerine ait bir dizi seçebilirsiniz mesela LHS'nin bir deterministik bir şekilde beklemeye görünmüyor 1 , 2 , 3 , . . . öyle ki hepsi [ 0 , 1 ) 2'nin köşegenine yapışır . Yani bir çeşit olasılık tanımı gerekli görünüyor. Let, her için n , X , n = ( X , n , 1 , X , n , 2 , . .1,2,3,...[0,1)2nXn=(Xn1,Xn2,...,Xnn)nnϵ>0x[0,1)dP(min1knXnkxϵ)0n

Örnek , dağılımından ('IID rastgele örnekleme') bağımsız örnek alınarak elde edilirse hacmi yarıçapı boyutlu top . Kesinlikle IID rastgele örnekleme asimptotik olarak yoğundur. n U ( [ 0 , 1 ) d ) P ( m i n 1 k nX n k - x ϵ ) = n k = 1 P ( X n k - x ϵ ) ( 1 - v ϵ 2 - d ) nXnnU([0,1)d)v ϵ d ϵ

P(min1knXnkxϵ)=k=1nP(Xnkxϵ)(1vϵ2d)n0
vϵdϵ

Şimdi numunelerinin LHS tarafından elde edildiği durumu düşünün . Bu notlardaki Teorem 10.1 , örnek üyelerinin hepsinin olarak dağıtıldığını belirtir . Bununla birlikte, LHS'nin tanımında kullanılan permütasyonlar (farklı boyutlar için bağımsız olmasına rağmen), örneğin üyeleri ( ) arasında bir miktar bağımlılığa neden olur , bu nedenle asimtotik yoğunluk özelliğinin sahip olduğu daha az açıktır.X n U ( [ 0 , 1 ) d ) X n k , k nXnXnU([0,1)d)Xnk,kn

ve düzeltin . Tanımla . olduğunu göstermek istiyoruz . Bunu yapmak için, Latin Hiperküp Örneklemesi için bir tür Merkezi Limit Teoremi olan bu notlarda Teklif 10.3'ü kullanabiliriz . Tanımlama ile ise yarıçapının topu olup çevresinde , , aksi. Sonra Önerme 10.3 bize nerede vex [ 0 , 1 ) D P , n = p ( m, i , n 1 k nX , n k - X ε ) p , n0 f : [ 0 , 1 ] DR f ( z ) = 1 z ϵ x f ( z )ϵ>0x[0,1)dPn=P(min1knXnkxϵ)Pn0f:[0,1]dRf(z)=1zϵxY n : = f(z)=0μ= [ 0 , 1 ] D f(Z)dz μ L H S = 1Yn:=n(μ^LHSμ)dN(0,Σ)μ=[0,1]df(z)dzμ^LHS=1ni=1nf(Xni) .

alın . Sonunda, yeterince büyük için . Sonuçta . Bu nedenle , burada standart normal cdf'dir. Yana keyfi olarak, bu şu gerektiği gibi.n - L>0nPn=P(Yn=-nμ<LPn=P(Yn=nμ)P(Yn<L)lim supPnlim supP(Yn<L)=Φ(LΣ)ΦLPn0

Bu, hem iid rastgele örnekleme hem de LHS için asimptotik yoğunluğu (yukarıda tanımlandığı gibi) kanıtlar. Gayrı, herhangi bir bu araçlar ve herhangi örnekleme uzayda, numune içinde alır olasılığı ait Eğer yeterince büyük örnek boyutu seçerek istedikleri gibi 1'e yakın olarak yapılabilir. Sonlu altkümedeki her noktaya zaten bildiğimiz şeyleri uygulayarak, asimtotik yoğunluk kavramını örnek alanının sonlu alt kümelerine uygulanacak şekilde genişletmek kolaydır. Daha resmi olarak, bu şunu gösterebileceğimiz anlamına gelir: herhangi bir ve örnek alanının sonlu alt kümeleri için,ϵxϵxϵ>0{x1,...,xm}min1jmP(min1knXnkxj<ϵ)1 ( ).n


İki soru var: Eğer sadece boyutta örnek varsa 1) nerede büyük, bu değişikliğin argüman nedir? Ve 2) Latin hiperküp örnekleri herhangi bir değer aralığında olabilir (sadece (0,1) değil), bu da cevabı değiştirir mi? nn

Ayrıca, neden yeterince büyük , sahip olacağımızı açıklamak ister misiniz ? Bunun büyük , sıfıra gittiği anlamına gelir , çünkü dağıtımda bir ? nnμnμ^LHSN(0,Σ)

@RustyStatistician Her şey sonlu örnekler olarak tanımlanır, yani ama large. Sonunda neler olduğunu açıklamak için ek açıklamalar ekledim. Diğer değer aralıkları, örnek boşluğunun hacmi sonlu olduğu sürece kolayca yerleştirilebilir ((0,1) özel değildir). n<
S.Catterall Monica'yı Geri

Kısa cevabınızı açıklayabilir misiniz?

@RustyStatistician Kısa cevap, uzun süren cevabımın gayrı resmi bir özeti. Bu nedenle, yukarıda önerildiği gibi, sorunuzu daha resmi terimlerle yeniden yazabilmeniz iyi olurdu, böylece denedim cevabımın doğru yolda (amaçlanan sorunuzu cevaplama açısından) olup olmadığını biliyorum.
S. Catterall Monica'yı Geri

3

Bunun istediğiniz gibi olup olmadığından emin değilim, ama işte gidiyor.

Diyelim ki den LHS-örnekleme puanınız var . Gayri resmi olarak, her bir , her bir boyutta boyutunda beklenen boş (hiper) cuboid sayısının olarak sıfıra gittiğini iddia edeceğiz .n[0,1)dϵ>0ϵn

Let yüzden biz bölmek eğer üniform olarak - küçük küboidler microcuboids , ki - genişliği o zaman her width- küboid içerir en az bir mikrokuboid. Dolayısıyla, örneklenmemiş mikrokübitlerin beklenen sayısının sıfır olduğunu, sınırında olduğunu gösterebilirsek, işimiz bitti demektir. ( Mikrokubidlerimizin düzenli bir ızgara üzerinde düzenlendiğini, ancak -cuboid'lerin herhangi bir konumda olabileceğini unutmayın.)m=2/ϵ[0,1)dmd1/mϵnϵ

İlk örnek noktası ile verilen bir mikrokübürün tamamen kaybolma şansı , ilk örnek koordinatları (ilk örnek noktası) serbestçe seçilebildiğinden , bağımsız olarak . İlk birkaç numune noktasının mikrokomoid'i kaçırdığı göz önüne alındığında, sonraki numune puanlarının kaçırılması daha zor olacaktır (ortalama olarak), bu nedenle tüm puanın eksik olma olasılığı .1mdndn(1md)n

Var olarak microcuboids yukarıda sınırlanmaktadır cevapsız beklenen sayı, yani beklentileri eklemek için - - ki bu olarak sınırda sıfır .md[0,1)dmd(1md)nn


Güncellemeler ...

(1) Burada verilen ne kadar gösteren bir resim , pick olabilir bir şekilde yeterince büyük olan en az bir microcuboid olduğu garanti edilir "microcuboids" (bu 2 boyutlu resimde kareler) ızgara bir boyutlu bölgesi. Ben iki "rastgele" -seçilmiş bölge gösterdim ve içerdiği iki mikrokubuk mor renkli var.ϵmm×m ϵ×ϵϵ×ϵ

resim açıklamasını buraya girin

(2) Herhangi bir mikrokuboid düşünün. Hacmin , tüm boşluğun kesri vardır . Böylece, tamamen serbestçe seçilen tek LHS örneği, olasılığı ile özleyecektir . Sadece önemli gerçeği bu sabit bir değer (biz vereceğiz olmasıdır ama tutmak den az olduğunu sabiti) .(1/m)dmd1mdnm1

(3) Şimdi örnek noktalarının sayısını düşünün . Resimde gösterdim. LHS, bu süper küçük boyutlu "nanoküpler" in ince bir ağında çalışır, eğer daha büyük boyutlu "mikrokuboidler", ancak aslında bu kanıtta önemli değildir. Kanıt, sadece daha fazla puan atarken belirli bir mikrokübürü kaçırmamak için ortalama olarak giderek zorlaştığına dair hafifçe el sallama ifadesine ihtiyaç duyuyor. Olduğu bu nedenle bir olasılık , ilk LHS'nin eksik ancak point daha fazla için her eksik bunların: sınırı olarak sıfırdırn>mn=6mn1×n1m1×m11md(1md)n nn .

(4) Tüm bu epsilons bir kanıt için iyidir, ancak sezginiz için harika değildir. Burada, en büyük boş dikdörtgen alan vurgulanmış olarak ve örnek noktasını gösteren birkaç resim var . (Izgara ızgara örnekleme LHS olduğunu - "nanocuboids" Daha önce değinilen.) O büyük boş alan örnek noktalarının sayısı olarak keyfi küçük boyutu küçülecek ki (bazı belirsiz sezgisel anlamda) "bariz" olmalıdır .n=10n=50n

resim açıklamasını buraya girin


Bu argüman genel bir süre için geçerli mi? yerine ? [0,1)

Evet, sonlu boyutlar için. Şimdi kanıtı düzelttiğim daha açık olmalı.
Creosote

bu kanıtın 1-d veya 2-d resmini vermek mümkün mü? İçimde oldukça kaybolmuşum.

Bitti. Gerekirse daha fazla soru almaktan mutluluk duyarız.
Creosote

Harika teşekkürler! Bu kesinlikle sezgiye yardımcı oluyor.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.