Nerede


36

aşağıdaki gibi merkezi sınırlı teoremin çok basit bir sürümü ki Lindeberg – Lévy CLT'dir. Neden sol tarafta bir olduğunu anlamıyorum . Ve Lyapunov CLT ama neden değil ? Birisi bana bu faktörlerin neler olduğunu söyler mi, ve ? onları teoremi nasıl alırız?

n((1ni=1nXi)μ) d N(0,σ2)
n
1sni=1n(Xiμi) d N(0,1)
snn1sn

3
Bu istatistik.stackexchange.com/questions/3734 adresinde açıklanmaktadır . Bu cevap uzun, çünkü “sezgi” diye soruyor. "Bu basit yaklaşım, Moivre'nin ilk başta evrensel bir sınırlayıcı dağılım olduğundan, logaritmasının ikinci dereceden bir işlev olduğu ve uygun ölçek faktörünün ile orantılı olması gerektiğinden olabileceğini gösteriyor. ... " snn
whuber

1
Sezgisel olarak, eğer tüm sonra ve 2. hat 1 hattından aşağıdaki gibidir: ile bölmek (elbette Lyapunov koşulu, kombinasyon kapalı hepsi , başka bir soru)σi=σsn=σi2=nσσ = s , n
n((1ni=1nXi)μ)=1ni=1n(Xiμ)d N(0,σ2)
1σ=snnσ i
1ni=1n(Xiμ)snn=1sni=1n(Xiμi)d N(0,1)
σi
Sextus Empiricus

Yanıtlar:


33

Güzel soru (+1) !!

Bağımsız rastgele değişkenler için ve , ve . Varyansı Böylece olan ve varyans , .Y, V , bir R ( x + Y ) = V , bir R ( X ) + V bir R ( Y ) V , bir R ( , bir x ) = a 2V bir R ( X )XYVar(X+Y)=Var(X)+Var(Y)Var(aX)=a2Var(X)n i = 1 σ 2 = n σ 2 ˉi=1nXii=1nσ2=nσ2nσ2/n2=σ2/nX¯=1ni=1nXinσ2/n2=σ2/n

Bu varyans içindir . Rastgele bir değişkeni standartlaştırmak için, standart sapmasına bölün. Bildiğiniz gibi, beklenen değer ise değişkeni böylece, μX¯μ

N(0,

X¯E(X¯)Var(X¯)=nX¯μσ
, 0 değerini ve varyansını bekler. 1. Bir , standart Gaussian . Birinci denklemdeki formülasyonunuz eşdeğerdir. Sol taraf çarpılarak varyansı ayarlayabilirsiniz .σ σ 2N(0,1)σσ2

İkinci nokta ile ilgili olarak, yukarıda gösterilen denklem sen bölme zorunda olduğunu göstermektedir inanıyoruz değil kullandığınız açıklarken, denklemi standardize etmek (tahmincisi ve .σ snσ)σsnσ)sn

Ekleme: @whuber , ölçeklendirmenin nedenini ile tartışmayı önerir . O öyle orada , ama cevap çok uzun olduğu için (Moivre düşünceleri de rekonstrüksiyonudur), argümanının derinliklerinden yakalamak için çalışacağız.n

Çok sayıda + 1 ve -1 eklerseniz, toplam sayımın basit sayma yoluyla olması olasılığını tahmin edebilirsiniz . Bu olasılığın günlüğü ile orantılıdır . Eğer yukarıdaki büyüklüğün büyükleştikçe bir sabite yakınsamasını istiyorsak, normalize edici bir faktör kullanmak zorundayız .j - j 2 / n n O ( njj2/nnO(n)

Modern (Post-Moivre) matematik araçlarını kullanarak, aranan olasılığın fark edildiğini fark ederek yukarıda belirtilen yaklaşımı görebilirsiniz.

P(j)=(nn/2+j)2n=n!2n(n/2+j)!(n/2j)!

Stirling'in formülü ile yaklaşık

P(j)nnen/2+jen/2j2nen(n/2+j)n/2+j(n/2j)n/2j=(11+2j/n)n+j(112j/n)nj.

log(P(j))=(n+j)log(1+2j/n)(nj)log(12j/n)2j(n+j)/n+2j(nj)/nj2/n.

Lütfen Michael C. ve Guy'ın önceki cevaplarına yorumlarımı inceleyin.
whuber

İlk denklem gibi görünüyor (LL CLT) s / b ? Bu da beni , varyans olarak göründü. σ 2n((1ni=1nXi)μ) d N(0,1)σ2
B_Miner

Gaussian'ı ortalama ve değişkenlikle standartlaştırırsanız (standart sapma değil) OP'nin formülünün doğru olduğuna inanıyorum.
gui11aume

1
Ahh..bağladısak, frak eğer tarafından biz (OP tarafından gösterildi olsun iptal): yani . Ancak VAR (aX) = a ^ 2Var (X) olduğunu biliyoruz, bu durumda a = ve Var (X) 1'dir, böylece dağıtım . ˉX¯E(X¯)Var(X¯)=nX¯μσd N(0,1)σσX¯E(X¯)Var(X¯)σσn((1ni=1nXi)μ)σ2N(0,σ2)
B_Miner

Gui, Çok geç değilse, bunun doğru olduğundan emin olmak istedim. varsayalım ve biz bu miktarın beklenen değerini (yani ) olan sabit bir ( ) ile ), sıfır olan, E [aX] = a * E [X] => * 0 = 0 olarak sıfırdır . Bu doğru mu? X¯E(X¯)Var(X¯)=n(X¯μ)d N(0,1)σn(X¯μ)σ
B_Miner

8

Ne tür bir dağılımın rasgele değişkenlerin toplamının dağılımını sınırladığına dair güzel bir teori var. Güzel kaynak, şahsen çok zevk aldığım Petrov'un yazdığı kitap .

Görünüşe göre bu tipin sınırlarını araştırıyorsanız burada bağımsız rastgele değişkenler, limitlerin dağılımı sadece belirli dağılımlar.

1ani=1nXnbn,(1)
Xi

Daha sonra etrafta dolaşan ve sınırda olanları tamamen karakterize eden birkaç teoremle kaynaşan bir çok matematik var. Bu tür teoremlerden biri Feller'den kaynaklanmaktadır:

Teoremi Let bağımsız rastgele değişken bir sekans olabilir, dağılımı fonksiyonu ve pozitif sabit bir dizisi. Amacıyla{Xn;n=1,2,...}Vn(x)Xnan

max1knP(|Xk|εan)0, for every fixed ε>0

ve

supx|P(an1k=1nXk<x)Φ(x)|0

bu gerekli ve yeterli

k=1n|x|εandVk(x)0 for every fixed ε>0,

an2k=1n(|x|<anx2dVk(x)(|x|<anxdVk(x))2)1

ve

an1k=1n|x|<anxdVk(x)0.

Bu teorem daha sonra neye benzemesi gerektiği konusunda bir fikir verir .an

Kitaptaki genel teori, normlama sabiti herhangi bir şekilde kısıtlanacak şekilde yapılandırılmıştır, ancak gerekli ve yeterli koşulları sağlayan son teoremler , dışında bir norm için sabit yer bırakmaz .n


4

s , numune ortalaması için örnek standart sapmayı temsil eder. s , örnek ortalamasının örnek varyansıdır ve S / n'ye eşittir . S ise popülasyon varyansının örnek tahminidir. S = S / √n'den beri, ilk formülde nasıl göründüğünü açıklar. Limit olsaydı, payda bir σ olacağını unutmayın.nn2n2n2nn

N (0,1) fakat limit N (0, ) olarak verilir. S tutarlı bir σ tahmini olduğundan, secnd denkleminde σ limitini çıkarmak için kullanılır.2n


Sorunun diğer (daha temel ve önemli) kısmı ne olacak: neden ve başka bir dağılım ölçüsü olmasın? sn
whuber

@whuber Bu tartışma için olabilir, ancak sorunun bir parçası değildi. OP, formülünde neden ve √n göründüğünü bilmek istedi . Elbette S vardır, çünkü σ için tutarlıdır ve CLT σ biçiminde çıkarılır. nn
Michael Chernick 19:12

1
Bana göre, in " için tutarlı" olması nedeniyle mevcut olduğu açık değil . Bu da neden aşırı değer istatistiklerini normalleştirmek için kullanılması gerektiğini (ki işe yaramayacağını) ima ? Basit ve açık bir şeyi mi özlüyorum? Ve, neden kullanmıyorsunuz - hepsinden önce, bu için tutarlı ! snσsnsnσ
whuber

Belirtildiği gibi teorem N (0,1) 'e yakınlaşmıştır, bu nedenle ya σ'yı bilmeniz ve kullanmanız ya da Slutsky'nin teoreminin çalıştığı tutarlı bir tahmin kullanmanız gerekir. Bu belirsiz miydi?
Michael Chernick 19:12

Belirsiz olduğunuzu sanmıyorum; Sadece önemli bir noktanın eksik olabileceğini düşünüyorum. Sonuçta, pek çok dağıtım için, yerine IQR kullanarak sınırlayıcı bir normal dağılım elde edebiliriz , ancak sonuç düzgün değildir (sınırlayıcı dağılımın başladığımız dağılıma bağlıdır). Sadece bunun çağrılmayı ve açıklanmayı hak ettiğini söylüyorum. 40 yıl boyunca geliştirdikleri sezgiye sahip olmayan biriyle karşılaştıkları tüm dağıtımları standartlaştıracak kadar açık olmayacak! sn
whuber

2

Sezgisel olarak, eğer bazı için ise kabaca ; Genel olarak gerekli olduğunu düşünmeme rağmen oldukça makul bir beklenti gibi görünüyor. Sebebi ilk ifadede varyansı olmasıdır gider gibi ve böylece için eşit olacak şekilde ifade sadece varyans sahip olduğu varyansı şişirmektir . İkinci ifadede terimi olarak tanımlanırZnN(0,σ2)σ2Var(Zn)σ2nX¯nμ01nnσ2sni=1nVar(Xi)payın varyansı gibi , yine de tüm ifadenin varyansının bir sabittir ( bu durumda ).i=1nVar(Xi)1

Temel olarak, dağılımında "ilginç" bir şey olduğunu biliyoruz , ancak düzgün şekilde merkezleyip ölçeklediğimizde onu göremeyiz. Bunun bazen mikroskobu ayarlamaya ihtiyaç duyduğu şeklinde tanımlandığını duydum. Biz patlatmak yoksa (örneğin) tarafından o zaman sadece var zayıf kanunla dağılımında; CLT kadar bilgilendirici olmamakla birlikte başlı başına ilginç bir sonuç. Herhangi bir etken ile şişirirken hakimdir , yine de alır ise bir faktör olan ağırlıkta olmakX¯n:=1niXiX¯μnX¯nμ0an an( ˉ X n-μ)0annan(X¯nμ)0an birn( ˉ X nnverir . Görünüşe göre bu durumda neler olup bittiğini görebilmek için sadece doğru büyütmedir (not: buradaki bütün yakınsaklık dağılımdadır; neredeyse kesin yakınsama için ilginç olan başka bir büyütme düzeyi vardır; yinelenen logaritma yasasına).an(X¯nμ)n


4
İlk olarak ele alınması gereken daha temel bir soru, SD'nin dağılmayı ölçmek için neden kullanıldığı. Neden başka bir değeri için mutlak merkezi anı olmasın ? Ya da neden IQR veya akrabalarından herhangi biri değil? Bu bir kez cevaplandıktan sonra, kovaryansın basit özellikleri derhal bağımlılığı verir (@ Gui11aume yakın zamanda açıklandığı gibi). k kthkn
whuber

1
@whuber Katılıyorum, bu yüzden bunu buluşsal olarak sunuyorum. Bunu duymak isterim basit bir açıklama için uygun olduğundan emin değilim. Benim için geçmişten daha basit ve açıklanabilir bir nedene sahip olduğumdan emin değilim "çünkü kare terimi, ortalamayı çıkardığınızda karakteristik fonksiyonun Taylor genişlemesinde ilgili terimdir."
Adam
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.