Merkezi limit teoremi ve Pareto dağılımı


10

Yanıtlar:


15

İfade genel olarak doğru değildir - eğer şekil parametresi ( ) 1'den büyükse Pareto dağılımı sonlu bir ortalamaya sahiptir.α

Hem ortalama hem de varyans ( ) olduğunda, merkezi limit teoreminin olağan formları - örneğin klasik, Lyapunov, Lindeberg uygulanacaktırα>2

Klasik merkezi limit teoreminin açıklamasına buradan bakın

Alıntı biraz gariptir, çünkü merkezi limit teoremi (belirtilen formlardan herhangi birinde) örnek ortalamanın kendisi için değil, standartlaştırılmış bir ortalamaya (ve ortalama ve varyansı olan bir şeye uygulamaya çalışırsak) sonlu değil, gerçekte ne hakkında konuştuğumuzu çok dikkatli bir şekilde açıklamamız gerekir, çünkü pay ve payda sonlu sınırları olmayan şeyleri içerir).

Bununla birlikte (merkezi limit teoremleri hakkında konuşmak için doğru bir şekilde ifade edilmemesine rağmen) altta yatan bir noktaya sahiptir - örnek ortalaması nüfus ortalamasına yakınlaşmayacaktır (büyük sayıların zayıf kanunu geçerli değildir, çünkü ortalamayı tanımlayan integral sonlu değildir).


Kjetil'in yorumlarda haklı olarak işaret ettiği gibi, yakınsama oranının korkunç olmasını önlemek için (yani pratikte kullanabilmek için), "ne kadar hızlı" / "ne kadar hızlı" Normal bir yaklaşımdan pratik bir kullanım istersek , (diyelim) için yeterli bir yaklaşıma sahip olmanın bir yararı yoktur .n>1010100

Merkezi limit teoremi varış noktasıyla ilgilidir ancak oraya ne kadar hızlı ulaştığımız hakkında hiçbir şey söylemez; Bununla birlikte, oranı (belirli bir anlamda) bağlayan Berry-Esseen teoremi teoremi gibi sonuçlar vardır . Berry-Esseen durumunda, üçüncü mutlak moment ( ) açısından standartlaştırılmış ortalamanın dağılım fonksiyonu ile standart normal cdf arasındaki en büyük mesafeyi sınırlar .E(|X|3)

Yani Pareto için, eğer , en azından yaklaşık yaklaşıklığın ne kadar kötü olabileceğine ve oraya ne kadar çabuk ulaştığımıza bağlı olabiliriz . (Öte yandan, cdfs'deki farkı sınırlamak zorunlu olarak özellikle "pratik" bir şey değildir - ilgilendiğiniz şey özellikle kuyruk alanındaki farkla ilgili bir sınırla ilişkili olmayabilir). Bununla birlikte, bir şeydir (ve en azından bazı durumlarda bir cdf bağlı daha doğrudan yararlıdır).α>3n


2
Ancak, varyans çok az mevcutsa, bu ama çok yakınsa, prensipte uygulanırken merkezi limit teoremi çok kötü yaklaşımlara yol açabilir. Yaklaşma kalitesi üzerinde biraz kontrol sahibi olmak için, üçüncü anları gerektiren Berry-Esseen teoremi gibi bir şeye ihtiyacınız vardır, yani, . α>2α>3
kjetil b halvorsen

@kjetil oldukça öyle; pratikte sadece ikinci anlardan daha fazlasına ihtiyacınız vardır çünkü yakınsama işe yaramaz şekilde yavaş olabilir.
Glen_b

1
Evet, bunu göstermek için bir cevap ekleyeceğim!
kjetil b halvorsen

2
Merkezi limit teoremini takip etmeyen bazı dağıtımlar, kararlı bir yasaya yakınlaşmak için standartlaştırılabilir.
Michael R.Chernick

Burada harika bir tartışma var. Istek stackexchange insanların cevaplarını / yorumlarını takip etmek için bir yol vardı;)
Chan-Ho Suh

9

CLT için varsayımların yerine getirildiği bir durumda bile, merkezi limit teoreminden (CLT) yaklaşımın pareto dağılımı için ne kadar kötü olabileceğini gösteren bir cevap ekleyeceğim. Varsayım, pareto için şu anlamına gelen sonlu bir varyansın olması gerektiğidir.α>2. Bunun neden böyle olduğuna dair daha teorik bir tartışma için, cevabımı burada bulabilirsiniz: Sonlu ve sonsuz varyans arasındaki fark nedir

Parametre ile pareto dağılımındaki verileri simüle edeceğim α=2.1, böylece varyans "zar zor var olur". Simülasyonlarımı yeniden yapα=3.1farkı görmek için! İşte bazı R kodu:

###  Pareto dist and the central limit theorem
###
require(actuar) # for (dpqr)pareto1()
require(MASS) #  for Scott()
require(scales) # for alpha()
# We use (dpqr)pareto1(x,alpha,1)
#
alpha <- 2.1  #  variance just barely exist
E <-  function(alpha) ifelse(alpha <= 1,Inf,alpha/(alpha-1))
VAR <- function(alpha) ifelse(alpha <= 2,Inf,alpha/((alpha-1)^2 * (alpha-2)))

R <- 10000
e <-  E(alpha)
sigma  <-  sqrt(VAR(alpha))
sim <-  function(n) {
    replicate(R, {x <- rpareto1(n,alpha,1)
        x <- x-e
        mean(x)*sqrt(n)/sigma },simplify=TRUE)
}
sim1 <- sim(10)
sim2 <- sim(100)
sim3 <- sim(1000)
sim4 <- sim(10000) # do take some time ...

### These are standardized so have all theoretically variance 1.
### But due to the long tail, the empirical variances are (surprisingly!) much lower:

sd(sim1)
sd(sim2)
sd(sim3)
sd(sim4)

### Now we plot the histograms:
    hist(sim1,prob=TRUE,breaks="Scott",col=alpha("grey05",0.95),main="simulated pareto means",xlim=c(-1.8,16))
hist(sim2,prob=TRUE,breaks="Scott",col=alpha("grey30",0.5),add=TRUE)
hist(sim3,prob=TRUE,breaks="Scott",col=alpha("grey60",0.5),add=TRUE)
hist(sim4,prob=TRUE,breaks="Scott",col=alpha("grey90",0.5),add=TRUE)
plot(dnorm,from=-1.8,to=5,col=alpha("red",0.5),add=TRUE)

Ve işte konu:

simüle pareto araçları, histogram

Bunu örnek boyutunda bile görebilirsiniz n=10000normal yaklaşımdan çok uzaktayız. Ampirik varyanslar gerçek teorik varyanstan çok daha düşüktürσ2=1aşırı sağ kuyruktaki dağılımın birçok örnekte görünmeyen kısımlarından sapmaya çok büyük bir katkımız olduğu gerçeğidir. Bu, varyans "zar zor var olduğunda" her zaman beklenmelidir . Bunu düşünmenin pratik bir yolu şudur. Pareto dağılımları genellikle gelir dağılımını modellemek için önerilmektedir. Gelir beklentisi (veya servet) çok az milyarderden çok büyük bir katkı sağlayacaktır. Pratik numune boyutlarıyla numune alma, numuneye milyarder ekleme olasılığı çok düşüktür!


3

Ben zaten verilen cevapları seviyorum ama "yatıyordu kişi açıklaması" için biraz fazla teknik olduğunu düşünüyorum bu yüzden daha sezgisel bir şey (bir denklem ile başlayan ...) deneyeceğim.

Yoğunluk ortalaması p olarak tanımlanır:

μ=xp(x)dx
Kısaca söylemek gerekirse, ortalama "toplam x"yoğunluğu arasındaki ürünün x ve xkendisi. Ne zamanx yoğunluğu sonsuzluğa eğilimlidir p(x) yeterince yok olmalı, böylece ürün xp(x)sonsuzluğa gitmez (ve sonuç olarak toplam da). Ne zamanp(x) yeterince yok olmaz, ürün sonsuza gider, integral sonsuza gider, μ mevcut değil ve son olarak, panlamı yok. Bu, belirli parametre değerleri için Pareto örneğidir.

Ardından, merkezi limit teoremi ampirik ortalama arasındaki mesafenin bir dağılımını oluşturur x¯=1nixi ve ortalama μ varyansının bir fonksiyonu olarak p ve n (asimpotik olarak n). Görgülerin ne anlama geldiğini görelimx¯ sayısının bir fonksiyonu olarak davranır n Gauss yoğunluğu için p:

N=10000;
x=rnorm(N,1,1);
y=rep(NA,N);
for(index in seq(1,N))
{
y[index]=mean(x[1:index])
}
png('~/Desktop/normalMean.png')
plot(y,type='l',xlab='n',ylab='sum(x_i)/n')
dev.off()

resim açıklamasını buraya girin

Bu tipik bir gerçekleştirmedir, numune ortalaması yoğunluk ortalamasına oldukça düzgün bir şekilde yakınlaşır (ve ortalama olarak merkezi limit teoreminin verdiği şekilde). Ortalama olmayan bir pareto dağılımı için aynısını yapalım (ikame rnormu (N, 1,1); pareto (N, 1.1,1);)

resim açıklamasını buraya girin

Bu aynı zamanda tipik bir simülasyon, zaman zaman, örnek ortalaması üründe integral formülü kullanılarak açıklandığı gibi basitçe sapıyor p(x)x, yüksek değerlerin sıklığı x şu gerçeği telafi edecek kadar küçük değil: xyüksektir. Yani ortalama yoktur ve örnek ortalama herhangi bir tipik değere yaklaşmaz ve merkezi limit teoreminin söyleyecek bir şeyi yoktur.

Son olarak, merkezi limit teoreminin ampirik ortalama, ortalama, örneklem büyüklüğü ile ilgili olduğuna dikkat edin. nve varyans. Yani varyans(xμ)2p(x)dx ayrıca mevcut olmalıdır (ayrıntılar için kjetil b halvorsen cevabına bakınız).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.