Aritmetik ortalama neden log-normal dağılımdaki dağılım ortalamasından daha küçüktür?

Yani, log-normal dağıtılmış rasgele değişkenler üreten rastgele bir süreç var . Karşılık gelen olasılık yoğunluk fonksiyonu: $X$

O orijinal dağılımın birkaç anının dağılımını tahmin etmek istedim , diyelim ki 1. an: aritmetik ortalama. Bunu yapmak için 10000 aritmetik ortalama 10000 tahminini yapabilmem için 10000 rasgele değişken 10000 kez çizdim.

Bu anlamı tahmin etmenin iki farklı yolu vardır (en azından anladığım bu: Yanlış olabilirim):

$\bar{X} = \sum_{i = 1}^{N} \frac{X_{i}}{N} .$ $\bar{X} = \sum_{i=1}^N \frac{X_i}{N}.$
$\sigma$ $\mu$ $μ = \sum_{i = 1}^{N} \frac{\log (X_{i})}{N} σ^{2} = \sum_{i = 1}^{N} \frac{{(\log (X_{i}) - μ)}^{2}}{N}$ $\mu = \sum_{i=1}^N \frac{\log (X_i)}{N} \quad \sigma^2 = \sum_{i=1}^N \frac{\left(\log (X_i) - \mu\right)^2}{N}$ $\bar{X} = \exp (μ + \frac{1}{2} σ^{2}) .$ $\bar{X} = \exp(\mu + \frac{1}{2}\sigma^2).$

Sorun, bu tahminlerin her birine karşılık gelen dağılımların sistematik olarak farklı olmasıdır:

"Düz" ortalama (kırmızı kesikli çizgi olarak temsil edilir) genellikle üstel formdan (yeşil düz çizgi) türetilene göre daha düşük değerler sağlar. Her iki araç da aynı veri kümesinde hesaplanır. Bu farkın sistematik olduğunu lütfen unutmayın.

Bu dağılımlar neden eşit değil?

— JohnW
kaynak

μ

$\mu$

σ

$\sigma$

μ = 3

$\mu = 3$

σ = 1.5

$\sigma = 1.5$

emin, bu sonuçlarınızı çoğaltma içindir.

— Christoph Hanck

x_{i}

$x_i$

y_{i}

$y_i$

\sum x_{i} / n

$\sum x_i/n$

\exp (\sum y_{i} / n)

$\exp(\sum y_i/n)$

\exp (s_{y}^{2} / 2)

$\exp(s_y^2/2)$

s_{y}^{2}

$s_y^2$

y_{i}

$y_i$ . Bu nedenle, herhangi bir ana dağılım için (pozitif rastgele sayıları tanımlayan) noktalı kırmızı eğri, sabit yeşil eğrinin solunda olmalıdır .

— whuber

Ortalamanın büyük bir kısmı çok büyük sayıların küçük bir olasılığından geliyorsa, sonlu bir örnek aritmetik ortalama, yüksek olasılıklı nüfus ortalamasını hafife alabilir. (Beklentide önemsizdir

— Matthew Gunn

$N$ $\exp[\mu+1/2\sigma^2]$

$\bar X\to_pE(X_i)$

\exp [\hat{μ} + 1 / 2 {\hat{σ}}^{2}] \to_{p} \exp [μ + 1 / 2 σ^{2}],

$\exp[\hat\mu+1/2\hat\sigma^2]\to_p\exp[\mu+1/2\sigma^2],$

\hat{μ} \to_{p} μ

$\hat\mu\to_p\mu$

{\hat{σ}}^{2} \to_{p} σ^{2}

$\hat\sigma^2\to_p\sigma^2$

Ancak MLE tarafsız değildir.

$N$ $\hat\mu$ $\hat\sigma^2$ $N=100$ $N-1$ $\mu$ $\sigma^2$

$E(\hat\mu+1/2\hat\sigma^2)\approx\mu+1/2\sigma^2$

E [\exp (\hat{μ} + 1 / 2 {\hat{σ}}^{2})] > \exp [E (\hat{μ} + 1 / 2 {\hat{σ}}^{2})] \approx \exp [μ + 1 / 2 σ^{2}]

$E[\exp(\hat\mu+1/2\hat\sigma^2)]>\exp[E(\hat\mu+1/2\hat\sigma^2)]\approx \exp[\mu+1/2\sigma^2]$

$N=100$

$N=1000$

Şununla oluşturuldu:

N <- 1000
reps <- 10000

mu <- 3
sigma <- 1.5
mm <- mle <- rep(NA,reps)

for (i in 1:reps){
  X <- rlnorm(N, meanlog = mu, sdlog = sigma)
  mm[i] <- mean(X)

  normmean <- mean(log(X))
  normvar <- (N-1)/N*var(log(X))
  mle[i] <- exp(normmean+normvar/2)
}
plot(density(mm),col="green",lwd=2)
truemean <- exp(mu+1/2*sigma^2)
abline(v=truemean,lty=2)
lines(density(mle),col="red",lwd=2,lty=2)

> truemean
[1] 61.86781

> mean(mm)
[1] 61.97504

> mean(mle)
[1] 61.98256

$\exp(\mu+\sigma^2/2)$

V_{t} = (σ^{2} + σ^{4} / 2) \cdot \exp {2 (μ + \frac{1}{2} σ^{2})},

$V_t = (\sigma^2 + \sigma^4/2)\cdot \exp\left\{2(\mu + \frac 12\sigma^2)\right\},$

\exp {2 (μ + \frac{1}{2} σ^{2})} (\exp {σ^{2}} - 1)

$\exp\left\{2(\mu + \frac 12\sigma^2)\right\}(\exp\{\sigma^2\}-1)$

\exp {σ^{2}} > 1 + σ^{2} + σ^{4} / 2,

$\exp\{\sigma^2\}>1+\sigma^2 + \sigma^4/2,$

\exp (x) = \sum_{i = 0}^{\infty} x^{i} / i!

$\exp(x)=\sum_{i=0}^\infty x^i/i!$

σ^{2} > 0

$\sigma^2>0$

$N$ N <- c(50,100,200,500,1000,2000,3000,5000)

$N$ $N$ $N=50$

> tail(sort(mm))
[1] 336.7619 356.6176 369.3869 385.8879 413.1249 784.6867
> tail(sort(mle))
[1] 187.7215 205.1379 216.0167 222.8078 229.6142 259.8727

— Christoph Hanck
kaynak

N

$N$

N = 100

$N=100$

N

$N$

Ben de iki yöntem arasında böyle büyük bir fark olduğunu şaşırıyorum, ancak bu örnek "sadece ortalama şeyler" korkunç neden göstermek için kesinlikle mükemmel !

— JohnW

@JohnW, MLE'nin neden daha küçük varyansa sahip olduğuna dair biraz analitik bir açıklama ekledim.

— Christoph Hanck

N

$N$

N \to \infty

$N\to\infty$