Merkezi Limit Teoremi ve Büyük Sayılar Yasası aynı fikirde olmadığında


19

Bu aslında math.se'de bulduğum ve umduğum cevapları alamadığım bir sorunun tekrarı .

Let bağımsız olarak, aynı dağılmış tesadüfi değişkenlerin bir sekansı olması ve \ mathbb {V} [x_i] = 1 .{Xben}benN-E[Xben]=1V[Xben]=1

Değerlendirmeyi düşünün

limnP(1nΣben=1nXbenn)

Eşitsizlik olayının her iki tarafı da sonsuzluğa eğilimli olduğu için bu ifade manipüle edilmelidir.

A) DENETİMİ DENEYİN

Sınırlayıcı ifadeyi düşünmeden önce , her iki taraftan da n :

limnP(1nΣben=1nXben-nn-n)=limnP(1nΣben=1n(Xben-1)0)=Φ(0)=12

CLT'nin son eşitliği, burada Φ() standart normal dağılım işlevidir.

B) TL ÇARPMA

Her iki tarafı 1/n

limnP(1n1nΣben=1nXben1nn)=limnP(1nΣben=1nXben1)

=limnP(X¯n1)=limnFX¯n(1)=1

burada FX¯n() , örnek ortalama X¯n , LLN tarafından olasılıkta (ve dolayısıyla dağıtımda) sabit 1 ve dolayısıyla son eşitliğe yakınsama dağılım işlevidir .

Böylece çelişkili sonuçlar alıyoruz. Hangisi doğru? Peki diğeri neden yanlış?


1
@JuhoKokkala Elbette, işte burada, math.stackexchange.com/q/2830304/87400 Sadece OP'nin buradaki hatasını göz ardı edin.
Alecos Papadopoulos

2
Sanırım sorun
LLN'yi

3
Son eşitliğe kadar seni takip ettim. Biz beklenir, çünkü açıkça yanlış yaklaşmak için büyük için ve eşit olmamalı bu nedenle onun sınırı bunun amaçlanan gerekçe nedir? Bildiğim büyük sayılar kanununun herhangi bir versiyonunun ifadesi değildir. 1 / 2 , n 1.P(X¯n1)1/2n1.
whuber

1
Sözde örnek için tüm olasılıkların değerine yoğunlaştığı varsayılmaktadır . Bu yanlışsa, hatanın bir cevapta detaylandırılmasının önemli olduğuna inanıyorum, bu sorunun amacı budur. 1
Alecos Papadopoulos

2
Alecos, endişem son adımın yanlış olup olmadığı değil: bunu yapma nedenlerinizle ilgilidir . Ne de olsa sorunun konusu değil mi? Hala sizden bu nedenleri veren bir şey okumadım ve ne olabileceğini tahmin etmekten bile çekinmem. Bir "LLN" ye başvurmanıza rağmen, sorununuzun çözümünün iddia etmek için "LLN" yi tam olarak anladığınızı tam olarak açıklamaktan kaynaklanacağına inanıyorum.
whuber

Yanıtlar:


15

Hata burada aşağıdaki aslında muhtemeldir: dağılımda yakınsama örtük varsayar için yakınsak en sürekliliğinin noktaları . Limit dağılımı sabit bir rasgele değişken olduğundan, bir atlama süreksizliği vardır , bu nedenle CDF'nin yaklaştığı sonucuna varmak yanlıştır . F ( x ) F ( x ) x = 1 F ( x ) = 1Fn(x)F(x) F(x)x=1F(x)=1


1
Ayrıştırmada yakınsamayı tanımlama şeklimiz , süreksizlik noktalarında yakınsama olasılığını dışlamaz - sadece gerektirmez .
Alecos Papadopoulos

1
Fakat dağılımdaki yakınsama e yakınsamasını gerektirmiyorsa , sorudaki son eşitlik neye dayanır? Fn(1)F(1)
Juho Kokkala

1
@Juho Hiçbir şeye dayanmıyor - işin özü bu. Birinin sorudaki son denklemi yapmasına izin veren hiçbir teorem yoktur.
whuber

1
@AlecosPapadopoulos: Olasılığı dışlamadığını asla söylemedim. Ben dolaylı olarak size, dağıtımdaki yakınsamadan size verilenin ötesindeki son eşitliği gerekçelendirmeniz gerektiğini söylüyorum. Örneğin, Bernoulli ise, o zaman doğru olur. Xn
Alex R.

11

İid rastgele değişkenleri için ile define Şimdi CLT söyler her için sabit gerçek sayı , . OP, değerlendirmek için uygular E [ X i ] = var ( X i ) = 1XbenE[Xben]=var(Xben)=1z

Zn=1nΣben=1nXben,Yn=1nΣben=1nXben.
zlim n P ( Z n1limnFZn(z)=Φ(z-1)
limnP(Zn1n)=Φ(0)=12.

OP'nin sorusundaki diğer yanıtların yanı sıra diğer cevapların da belirttiği gibi, OP'nin olan değerlendirmesi. İid eşit olasılık ile ve değerlerini alan ayrık rasgele değişkenler olduğunda özel durumu düşünün . Şimdi, deki tüm tam sayı değerlerini alabilir ve bu nedenle garip olduğunda , değerini ve dolayısıyla değerini alamazX i 0 2 1limnP(Yn1)Xben02 n i = 1 Xi12Σben=1nXbenn n i = 1 X i n Y n = 1[0,2n]nΣben=1nXbennYn=1nΣben=1nXben Y n 1 P ( Y n1 ) = F Y n ( 1 ) 11. Dağılımı Dahası, etrafında simetriktir, , söz konusu olan değerine sahip olduğu her garip. Bu durumda, dizi numaralarının içeren alt-dizi tüm terimlerin değeri . Öte yandan, alt-dizi olan yakınsak için . Bu nedenle,Yn1P(Yn1)=FYn(1) nP(Y11),P(Y21),,P(Yn1),P(12n

P(Y11),P(Y21),...,P(Yn1),...
1
P(Y11),P(Y31),...,P(Y2k-11),...
P(Y21),P(Y41),,P(Y2k1),1limnP(Yn1)P(Yn1)12
P(Y21),P(Y41),,P(Y2k1),
1limnP(Yn1) mevcut değildir ve 'in 1'e yakınsama iddiaları büyük bir şüphe ile görülmelidir.P(Yn1)

8

İlk sonucunuz doğru sonuçtur. Hatanız ikinci bölümde, aşağıdaki hatalı ifadede oluşur:

limnFX¯n(1)=1.

Bu ifade yanlıştır (sağ taraf ) ve iddia edildiği gibi büyük sayıların yasalarına uymaz . Büyük sayıların (çağırdığınız) zayıf kanunu şöyle diyor:12

limnP(|X¯n-1|ε)=1hepsi için ε>0.

Tüm için bazı değerleri ve bazı değerleri . Bu nedenle, takip etmez NAS o .| ˉ X n - 1 | s ˉ X , n1 ˉ X , n > 1 lim N ∞ iken P ( ˉ X , n1 ) = 1ε>0|X¯n-1|εX¯n1X¯n>1limnP(X¯n1)=1


1
(Gerçekten hatalı) sonuç "olasılıkta yakınsama, dağılımda yakınsama anlamına gelir" sonucundan gelir. Soru, iddianın doğrudan LLN'den geldiğini belirtmez .
Alecos Papadopoulos

@AlecosPapadopoulos: olasılık Yakınsama yapar dağılımında yakınlaşma anlamına. Yine, dağıtımda yakınsama sadece süreklilik noktalarında gereklidir. Ancak, belki olasılıkta yakınsama, dağıtımın noktaya yakınsaması anlamına gelmez demek istediniz .
Alex R.

@AlexR. İtirazınızın nerede olduğundan emin değilim. Bu sorunun kendi cevabımda yer aldığını düşünüyorum.
Alecos Papadopoulos

3

Olasılıkta yakınsama dağılımda yakınsama anlamına gelir. Ama ... ne dağılımı? Sınırlayıcı dağılımın bir sıçrama süreksizliği varsa, limitler belirsiz hale gelir (çünkü süreksizlikte birden fazla değer mümkündür).

burada , örnek ortalama , LLN tarafından olasılıkta (ve böylece dağıtımda) sabit birleştiği dağılım işlevidir ,ˉ X n 1FX¯n()X¯n1

Bu doğru değildir ve doğru olamayacağını da göstermek kolaydır (CLT ve LLN arasındaki anlaşmazlıktan farklı). Sınırlayıcı dağılım (normal dağıtılmış değişkenlerden oluşan bir dizi için sınır olarak görülebilir):

FX¯(x)={0for x<10.5for x=11for x>1

bu işlev için, herhangi bir ve her için yeterince büyük için . yerine olursa bu başarısız olur.x | F ˉ X n ( x ) - F ˉ X ( x ) | < ϵ n F ˉ X ( 1 ) = 1 F ˉ X ( 1 ) = 0,5ϵ>0x|FX¯n(x)FX¯(x)|<ϵnFX¯(1)=1FX¯(1)=0.5


Normal dağılım sınırı

Büyük sayılar yasasını çağırmak için kullanılan toplamı açıkça yazmak yararlı olabilir.

X¯n=1nΣben=1nXben~N-(1,1n)

için sınırı aslında varyans sıfıra gidecek şekilde normal dağılımın sınırı olarak temsil edildiğinde Dirac Delta işlevine eşdeğerdir.X nnX^n

Bu ifadeyi kullanarak, CLT'nin hazır kanunlarını kullanmak yerine yasaların ardındaki mantığı gizleyen bir LLN kullanmak yerine, kaputun altında neler olup bittiğini görmek daha kolaydır.


Olasılıkta yakınsama

Büyük sayılar kanunu size 'olasılıkta yakınsama' verir

limnP(|X¯n1|>ϵ)=0

ileϵ>0

ile merkezi limit teoremi için eşdeğer bir ifade yapılabilir. limnP(|1n(Xi1)|>ϵn)=0

Bunun anlamına geldiğini belirtmek yanlıştır.

limnP(|X¯n1|>0)=0

Bu sorunun bu kadar erken gönderilmesi daha az hoştur (kafa karıştırıcı, ancak matematiğe karşı istatistiklerin farklı tartışmalarını / yaklaşımlarını görmek ilginçtir, bu yüzden çok kötü değil). Cevap çok etkili bir güçlü büyük sayılar hukuku bakımından onunla matematik Stack Exchange fırsatlar Michael Hardy tarafından (burada çapraz nakledilen söz ve Dilip içinde drhab gelen kabul cevap olarak aynı prensip). Biz neredeyse emin bir dizi olduğunu vardır 1'e yakınsak, ancak bu demek değildir kiX¯1,X¯2,X¯3,...X¯nlimnP(X¯n=1)1'e eşit olacaktır (veya Dilip'in gösterdiği gibi mevcut olmayabilir). Tomasz'ın yorumlarındaki zar örneği bunu farklı bir açıdan çok güzel gösteriyor (limit mevcut değil, limit sıfıra gidiyor). Bir zar merdanesi dizisinin ortalaması zarların ortalamasına yakınsa da buna eşit olma olasılığı sıfıra iner.


Heaviside basamak fonksiyonu ve Dirac delta fonksiyonu

KTL aşağıdaki gibidir:X¯n

FX¯n(x)=12(1+erfx12/n)

isterseniz, ( Heaviside adım işleviyle ilgili olarak , Dirac delta işlevinin sınırı, normal dağılım).limnFX¯n(1)=0.5


Bu görüşün 'yanlış olduğunu göster' ile ilgili sorunuzu sezgisel olarak çözdüğüne veya en azından CLT ve LLN'nin bu anlaşmazlıklarının nedenini anlama hakkındaki sorunun Dirac delta işlevinin integralini anlama sorununa eşdeğer olduğuna inanıyorum. veya varyans sıfıra inen bir normal dağılım dizisidir.


2
Sınırlayıcı dağılımınız aslında bir dağıtım değildir. Bir CDF doğru sürekli olmalıdır, oysa açıkça . x=1/2
Alex R.

Sağ süreklilik gibi her türlü için gerekli gibi görünmektedir Elimizdeki olayları olarak yuvalanmıştır ama bu bizim durumumuz için doğru mu ve yakalama nerede? Bu doğru süreklilik olasılık aksiyomlarına dayalı mıdır, yoksa sadece CDF en sık karşılaşılan vakalar için geçerli olacak bir sözleşme midir? lim n F X ( a + 1aX a + 1limnFX(a+1n)=FX(a)Xa+1n
limnFX(a+1n)=limnP(Xa+1n)=P(limnXa+1n)=P(Xa)=FX(a)
Sextus Empiricus

@Martin Weterings: Burası tam olarak nereden geliyor? Geçerli herhangi bir ölçüsü bu monotonluk sonuçlarını sağlamalıdır. Bunlar sayılabilir katkı ile birlikte sınırlılığının bir sonucudur . Daha genel olarak, fonksiyonu bir CDF'dir (yani , iff üzerinden monotonik olmakla birlikte sürekli bir dağılımına karşılık gelir. ve sol sınırı 0, sağ sınırı 1. olanP F ( x ) P F ( b ) - F ( a ) = P ( a < X b ) FPPF(x)PF(b)F(a)=P(a<Xb)F
Alex R.

2

"CLT yaklaşımı" nın doğru cevabı verdiğinin şimdiye kadar net olması gerektiğine inanıyorum.

"LLN yaklaşımı" nın tam olarak nerede yanlış gittiğini tespit edelim.

Sonlu deyimlerle başlayarak , her iki taraftan da 'i aynı şekilde çıkarabiliriz veya her iki tarafı da çarpabiliriz . Biz olsun 1/n1/n

P(1ni=1nXin)=P(1ni=1n(Xi1)0)=P(1ni=1nXi1)

Yani sınır varsa, aynı olacaktır. Ayar biz kullanılarak, dağıtım işlevleriniZn=1ni=1n(Xi1)

P(1ni=1nXin)=FZn(0)=FX¯n(1)

... ve olduğu doğrudur .limnFZn(0)=Φ(0)=1/2

"LLN yaklaşımı" ndaki düşünce şu şekildedir: " olasılık içinde bir sabitle birleştiğini biliyoruz. Ayrıca" olasılıkta yakınsama dağılımda yakınsama anlamına gelir ". yakınsar msgstr "% s" bir sabite dağıtımda. Buraya kadar doğruyuz. Sonra şunu belirtiyoruz: "bu nedenle, için sınırlama olasılıkları sabitin rasgele değişkendeki dağılım fonksiyonu ile verilir ",X¯nX¯n
X¯n1

F1(x)={1x10x<1F1(1)=1

... yani ...limnFX¯n(1)=F1(1)=1

... ve biz sadece hata yaptık . Neden? Çünkü @AlexR gibi. cevap "dağıtımda yakınsama" sadece sınırlama dağılım fonksiyonunun süreklilik noktalarını kapsar . Ve , için bir süreksizlik . Bu, , eşit olabileceği , ancak "sabit bir dağıtımda yakınsama" etkisini reddetmeden olmayabilir. .1F1limnFX¯n(1) F1(1)

Ve CLT yaklaşımından beri sınırın değerinin ne olması gerektiğini biliyoruz ( ). Doğrudan olduğunu kanıtlamanın bir yolunu bilmiyorum .1/2limnFX¯n(1)=1/2

Yeni bir şey öğrendik mi?

Yaptım. LLN,

limnP(|X¯n-1|ε)=1hepsi için ε>0

limn[P(1ε<X¯n1)+P(1<X¯n1+ε)]=1

limn[P(X¯n1)+P(1<X¯n1+ε)]=1

LLN, olasılıkın aralığında nasıl tahsis edildiğini söylemez . Öğrendiğim şey, bu yakınsama sınıfında, olasılıkın çöken aralığın merkez noktasının iki tarafına eşit olarak tahsis edilen sınırda olmasıdır. (1ε,1+ε)

Buradaki genel açıklama,

Xnpθ,h(n)(Xnθ)dD(0,V)

burada , dağıtım fonksiyonu olan bazı . SonraDFD

limnP[Xnθ]=limnP[h(n)(Xnθ)0]=FD(0)

... (rv sabitinin dağılım işlevi ile eşit olmayabilir .Fθ(0)

Ayrıca, sınırlayıcı rasgele değişkenin dağılım fonksiyonu süreksizliklere sahip olduğunda, o zaman "rasgele değişkene dağılımda yakınsama", "sınırlama dağılımının" sınırlamanın dağılımı ile aynı fikirde olamayacağı bir durumu tanımlayabileceğine dair güçlü bir örnektir. süreksizlik noktalarında. Kesin olarak, süreklilik noktaları için sınırlayıcı dağılım, sabit rasgele değişkenin dağılımıdır. Süreksizlik noktaları için, sınırlama olasılığını "ayrı" varlıklar olarak hesaplayabiliriz.


'Öğrenilen ders' bakış açısı ilginçtir ve bu, didaktik uygulama için iyi, çok zor olmayan bir örnektir. Sonsuz hakkındaki bu düşüncenin ne tür (doğrudan) pratik bir uygulama olduğunu merak etsem de, sonunda uygulamadan
Sextus Empiricus

@MartijnWeterings Martijn, buradaki motivasyon kesinlikle eğiticiydi, a) bir sabite yakınsama gibi "düz" bir durumda bile süreksizliklere karşı bir uyarı olarak ve ayrıca genel olarak (örneğin üniform yakınsamayı yok ederler) ve b) olasılık kütlesinde bir sabite yaklaşan sekans hala sıfır olmayan bir varyansa sahip olduğunda olasılık kütlesinin nasıl tahsis edildiğine dair bir sonuç ilginç hale gelir.
Alecos Papadopoulos

CLT'nin sınırlayıcı normal dağıtılmış değişkene yakınsama hakkında bir şey söyleyebileceğini söyleyebiliriz (böylece gibi şeyleri ifade edebiliyoruz ), ancak LLN sadece örnek boyutunu artırarak daha yakınlaştığımızı söylememize izin veriyor ancak bu, daha yüksek olasılıkla, 'örnek ortalamasına tam olarak eşittir' demek değildir. LLN, örnek ortalamanın sınırlayıcı bir değere yaklaştığını ve yaklaştığını, ancak buna (daha yüksek olasılıkla) eşit olmadığını ifade eder. LLN hakkında hiçbir şey söylemiyorF(x)F(x)
Sextus Empiricus

LLN'nin etrafındaki orijinal düşünceler tam tersidir (Arbuthnot istatistiklerinin muhakemesine bakın . Stackexchange.com/questions/343268 ). "Söylenenlerden görülebiliyor ki, çok sayıda Zar ile A'nın Lotu çok küçük olacaktı ... tüm olası Şansların küçük bir kısmı, herhangi bir atanabilir zamanda gerçekleşmesi için, eşit sayıda Erkek ve Kadın doğmalıdır. "
Sextus Empiricus
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.