Birim çember ve birim kare arasında verimli puanlar üretin

Burada tanımlanan mavi bölgeden örnekler oluşturmak istiyorum:

Saf çözüm, birim karede reddetme örneklemesi kullanmaktır, ancak bu sadece (~% 21.4) verimlilik sağlar. $1-\pi/4$

Daha verimli örneklememin bir yolu var mı?

— Cam.Davidson.Pilon
kaynak

İpucu : Verimliliğinizi iki katına çıkarmak için simetri kullanın.

— kardinal

Oh like: değer (0,0) ise, bu (1,1) ile eşlenebilir mi? Bu fikri seviyorum

— Cam.Davidson.Pilon

@cardinal Verimliliği 4 kat artırmamalı mı?

içinde örnekleme yapabilirsiniz

[0, \dots, 1] \times [0, \dots, 1]

$[0,\ldots,1] \times [0,\ldots,1]$ ile ve ardından x ekseni, y ekseni ve orijini aynalayabilirsiniz.

— Martin Krämer

@Martin: Dört simetrik bölgede, daha dikkatli bir şekilde uğraşmak zorunda olduğunuz örtüşmeye sahipsiniz.

— kardinal

@Martin: Ben sizin tarif ettiğiniz anlayarak ediyorum, bu verimliliği artmaz hiç . (Bir nokta buldunuz ve şimdi

nin yapılıp yapılmadığına göre birim disk içinde ya da yok olan üç tane - boyutun dört katı bir alanda - tanıyorsunuz . Verimliliğin artırılması noktası üretilen her

için kabul olasılığını arttırmaktır . Belki de yoğun olan benim.

(x, y)

$(x,y)$

(x, y)

$(x,y)$

— kardinal

Yanıtlar:

Saniyede iki milyon puan kazanacak mı?

Dağıtım simetriktir: sadece tüm dairenin sekizde biri için dağıtımı yapmamız ve sonra diğer oktanların etrafına kopyalamamız gerekir. Kutupsal koordinatlarda , açı kümülatif dağılım rastgele konum değeri ile üçgen arasındaki alan ile verilmiştir $(r,\theta)$ $\Theta$ $(X,Y)$ $\theta$ veuzanan dairenin yayı $(0,0), (1,0), (1,\tan\theta)$ ila . Böylece orantılıdır. $(1,0)$ $(\cos\theta,\sin\theta)$

F_{Θ} (θ) = Pr (Θ \leq θ) \propto \frac{1}{2} \tan (θ) - \frac{θ}{2},

$F_\Theta(\theta) = \Pr(\Theta \le \theta) \propto \frac{1}{2}\tan(\theta) - \frac{\theta}{2},$

yoğunluğu

f_{Θ} (θ) = \frac{d}{d θ} F_{Θ} (θ) \propto \tan^{2} (θ) .

$f_\Theta(\theta) = \frac{d}{d\theta} F_\Theta(\theta) \propto \tan^2(\theta).$

Bu yoğunluktan, örneğin, verimi olan bir reddetme yöntemi kullanarak örnekleme yapabiliriz ). $8/\pi-2 \approx 54.6479\%$

Koordinat radyal koşullu yoğunluk ile orantılıdır arasındaki ve $R$ $rdr$ $r=1$ . Bu, CDF'nin kolayca ters çevrilmesi ile örneklenebilir. $r=\sec\theta$

Bağımsız numuneler , Kartezyen koordinatlara dönüş bu oktanı örnekler. Numuneler bağımsız olduğu için, koordinatları rastgele değiştirmek, istendiği gibi birinci kadranda bağımsız bir rasgele numune üretir. (Rastgele değiş tokuşlar, gerçekleşecek kaç gerçekleşmenin değişeceğini belirlemek için yalnızca tek bir Binom değişkeni oluşturulmasını gerektirir.) $(r_i,\theta_i)$ $(x_i,y_i)$

Her biri, gerçekleştirilmesi , ortalama, tek tip bir varyant ile (için, ihtiyaç ) artı iki katı homojen için (dağılımı özellikleri ) ve (hızlı) hesaplama küçük bir miktar. Bu $(X,Y)$ $R$ $1/(8\pi-2)$ $\Theta$ nokta başına değişmektedir (ki bu elbette iki koordinatı vardır). Tüm ayrıntılar aşağıdaki kod örneğinde verilmiştir. Bu rakam, üretilen yarım milyondan fazla noktanın 10.000'ini çiziyor. $4/(\pi-4) \approx 4.66$

İşte Rbu simülasyonu üreten ve zamanlayan kod.

n.sim <- 1e6
x.time <- system.time({
  # Generate trial angles `theta`
  theta <- sqrt(runif(n.sim)) * pi/4
  # Rejection step.
  theta <- theta[runif(n.sim) * 4 * theta <= pi * tan(theta)^2]
  # Generate radial coordinates `r`.
  n <- length(theta)
  r <- sqrt(1 + runif(n) * tan(theta)^2)
  # Convert to Cartesian coordinates.
  # (The products will generate a full circle)
  x <- r * cos(theta) #* c(1,1,-1,-1)
  y <- r * sin(theta) #* c(1,-1,1,-1)
  # Swap approximately half the coordinates.
  k <- rbinom(1, n, 1/2)
  if (k > 0) {
    z <- y[1:k]
    y[1:k] <- x[1:k]
    x[1:k] <- z
  }
})
message(signif(x.time[3] * 1e6/n, 2), " seconds per million points.")
#
# Plot the result to confirm.
#
plot(c(0,1), c(0,1), type="n", bty="n", asp=1, xlab="x", ylab="y")
rect(-1, -1, 1, 1, col="White", border="#00000040")
m <- sample.int(n, min(n, 1e4))
points(x[m],y[m], pch=19, cex=1/2, col="#0000e010")

— whuber
kaynak

Bu cümleyi anlamıyorum: "Numuneler bağımsız olduğu için, her ikinci numunenin sistematik olarak koordinatlarını değiştirmek, istendiği gibi birinci kadranda bağımsız bir rasgele numune üretir." Bana öyle geliyor ki, her ikinci örneğin sistematik olarak koordinatlarını değiştirmek son derece bağımlı örnekler üretiyor. Örneğin, bana göre, koddaki uygulamanız aynı oktandan üst üste yarım milyon örnek oluşturuyor mu?

— A. Rex

Açıkçası, bu yaklaşım (iid noktaları için) pek işe yaramıyor çünkü iki oktanda aynı sayıda örnek üretiyor: Bu nedenle örnek noktaları bağımlıdır. Şimdi, her örnek için oktanı belirlemek için tarafsız paraları çevirirseniz ...

— kardinal

@Cardinal haklısın; Bunu düzelteceğim - (asimptotik olarak) üretmek için rastgele değişkenlerin sayısını artırmadan!

— whuber

Kesinlikle sonlu örnek durumunda, sizin modifikasyon gerektirir (yalnızca en saf teorik anlamda, tekrar ve) konuşan hiçbir ek üniforma rastgele değişebilirlerin. Wit için: İlk tekdüze rasgele değişkenden, ilk

bitinden saygısız diziyi oluşturun . Ardından, geri kalanını (çarpı

) oluşturulan ilk koordinat olarak kullanın.

n

$n$

2^{n}

$2^n$

— kardinal

@ Xi'an Uygun şekilde hesaplanabilen bir ters elde edemedim. Bir sinüsü hesaplamak zorunda kalarak

(oran

yoğunlukta dağılımdan reddederek örnekleme yaparak biraz daha iyi yapabilirim. .

2 \sin (θ)^{2}

$2\sin(\theta)^2$

(4 - π) / (π - 2) \approx 75 %

$(4-\pi)/(\pi-2)\approx 75\%$

— whuber

Şimdiye kadar @cardinal, @whuber ve @ stephan-kolassa'nın diğer çözümlerden daha basit, daha verimli ve / veya hesaplamalı olarak daha ucuz olması gereken aşağıdaki çözümü öneriyorum.

Aşağıdaki basit adımları içerir:

1) İki standart tek tip numune çizin:

u_{1} \sim U n i f (0, 1) u_{2} \sim U n i f (0, 1) .

$u_1 \sim Unif(0,1)\\ u_2 \sim Unif(0,1).$

$\min\{u_1,u_2\}, \max\{u_1,u_2\}$

[\begin{matrix} x \\ y \end{matrix}] = [\begin{matrix} 1 \\ 1 \end{matrix}] + [\begin{matrix} \frac{\sqrt{2}}{2} & - 1 \\ \frac{\sqrt{2}}{2} - 1 & 0 \end{matrix}] [\begin{matrix} min {u_{1}, u_{2}} \\ max {u_{1}, u_{2}} \end{matrix}] .

$\begin{bmatrix} x\\y \end{bmatrix} = \begin{bmatrix} 1\\1 \end{bmatrix} + \begin{bmatrix} \frac{\sqrt{2}}{2} & -1\\ \frac{\sqrt{2}}{2} - 1 & 0\\ \end{bmatrix} \, \begin{bmatrix} \min\{u_1,u_2\}\\ \max\{u_1,u_2\}\\ \end{bmatrix}.$

2b) Swap $x$ and $y$ if $u_1 > u_2$ .

3) Reject the sample if inside the unit circle (acceptance should be around 72%), i.e.:

x^{2} + y^{2} < 1.

$x^2 + y^2 < 1.$

The intuition behind this algorithm is shown in the figure.

Steps 2a and 2b can be merged into a single step:

2) Apply shear transformation and swap

x = 1 + \frac{\sqrt{2}}{2} min (u_{1}, u_{2}) - u_{2} y = 1 + \frac{\sqrt{2}}{2} min (u_{1}, u_{2}) - u_{1}

$x = 1 + \frac{\sqrt{2}}{2} \min(u_1, u_2) - u_2\\ y = 1 + \frac{\sqrt{2}}{2} \min(u_1, u_2) - u_1$

The following code implements the algorithm above (and tests it using @whuber's code).

n.sim <- 1e6
x.time <- system.time({
    # Draw two standard uniform samples
    u_1 <- runif(n.sim)
    u_2 <- runif(n.sim)
    # Apply shear transformation and swap
    tmp <- 1 + sqrt(2)/2 * pmin(u_1, u_2)
    x <- tmp - u_2
    y <- tmp - u_1
    # Reject if inside circle
    accept <- x^2 + y^2 > 1
    x <- x[accept]
    y <- y[accept]
    n <- length(x)
})
message(signif(x.time[3] * 1e6/n, 2), " seconds per million points.")
#
# Plot the result to confirm.
#
plot(c(0,1), c(0,1), type="n", bty="n", asp=1, xlab="x", ylab="y")
rect(-1, -1, 1, 1, col="White", border="#00000040")
m <- sample.int(n, min(n, 1e4))
points(x[m],y[m], pch=19, cex=1/2, col="#0000e010")

Some quick tests yield the following results.

Algorithm /stats//a/258349 . Best of 3: 0.33 seconds per million points.

This algorithm. Best of 3: 0.18 seconds per million points.

— Luca Citi
kaynak

+1 Very well done! Thank you for sharing a thoughtful, clever, and simple solution.

— whuber

Great idea! I was thinking about a mapping from the unit sq to this portion, but didn't think of an imperfect mapping and then a rejection scheme. Thanks for expanding my mind!

— Cam.Davidson.Pilon

Well, more efficiently can be done, but I sure hope you are not looking for faster.

The idea would be to sample an $x$ value first, with a density proportional to the length of the vertical blue slice above each $x$ value:

f (x) = 1 - \sqrt{1 - x^{2}} .

$f(x) = 1-\sqrt{1-x^2}.$

Wolfram helps you to integrate that:

\int_{0}^{x} f (y) d y = - \frac{1}{2} x \sqrt{1 - x^{2}} + x - \frac{1}{2} \arcsin x .

$\int_0^x f(y)dy = -\frac{1}{2}x\sqrt{1-x^2}+x-\frac{1}{2}\arcsin x.$

So the cumulative distribution function $F$ would be this expression, scaled to integrate to 1 (i.e., divided by $\int_0^1 f(y)dy$ ).

Now, to generate your $x$ value, pick a random number $t$ , uniformly distributed between $0$ and $1$ . Then find $x$ such that $F(x)=t$ . That is, we need to invert the CDF (inverse transform sampling). This can be done, but it's not easy. Nor fast.

Finally, given $x$ , pick a random $y$ that is uniformly distributed between $\sqrt{1-x^2}$ and $1$ .

Below is R code. Note that I am pre-evaluating the CDF at a grid of $x$ values, and even then this takes quite a few minutes.

You can probably speed the CDF inversion up quite a bit if you invest some thinking. Then again, thinking hurts. I personally would go for rejection sampling, which is faster and far less error-prone, unless I had very good reasons not to.

epsilon <- 1e-6
xx <- seq(0,1,by=epsilon)
x.cdf <- function(x) x-(x*sqrt(1-x^2)+asin(x))/2
xx.cdf <- x.cdf(xx)/x.cdf(1)

nn <- 1e4
rr <- matrix(nrow=nn,ncol=2)
set.seed(1)
pb <- winProgressBar(max=nn)
for ( ii in 1:nn ) {
    setWinProgressBar(pb,ii,paste(ii,"of",nn))
    x <- max(xx[xx.cdf<runif(1)])
    y <- runif(1,sqrt(1-x^2),1)
    rr[ii,] <- c(x,y)
}
close(pb)

plot(rr,pch=19,cex=.3,xlab="",ylab="")

— S. Kolassa - Reinstate Monica
kaynak

I wonder if using Chebyshev polynomials to approximate the CDF would improve the evaluation speed.

— Sycorax says Reinstate Monica

@Sycorax, not without modifications; see e.g. the chebfun treatment of algebraic singularities at the endpoints.

— J. M. is not a statistician