Bir gözlem verilen varyans için Güven Aralığı


25

Bu, "Olasılık Teorisinde 7. Kolmogorov Öğrenci Olimpiyatı" nın bir sorunu:

Bir gözlem verilen bir gelen her iki parametre bilinmeyen ile dağıtımı için bir güven aralığını elde , en az% 99 güven aralığı ile.XNormal(μ,σ2)σ2

Bana öyle geliyor ki bu imkansız olmalı. Çözüm bende, ancak henüz okumadım. Düşüncesi olan var mı?

Birkaç gün içinde çözümü yollayacağım.

[Takip düzenleme: Resmi çözüm aşağıda yayınlanmıştır. Kardinal çözümü daha uzun, ancak daha iyi bir güven aralığı veriyor. Ayrıca girişleri için Max ve Glen_b'a teşekkürler.]


1
Bana da imkansız geliyor; Ben cevabı bekliyor
Peter FLOM - Eski Monica

1
Bu siteye göz atın .
normalde

3
İşte daha iyi biçimlendirilmiş bir kağıt: kağıt .
normalde

Heh. Yıllar önce, bu konuda bir makale okuduğumu hatırlıyorum Olabilirdi bu bir.
Glen_b

1
@Max, bağlantı için teşekkürler! Daha yakından bakmak için zamanım olmadı, ama yapacağım. Aşağıdaki "resmi" cevabı gönderdim.
Jonathan Christensen,

Yanıtlar:


17

Olasılık eşitsizliği ve çoklu gözlem vakasına bağlantıların objektifinden bakıldığında, bu sonuç pek imkansız görünmeyebilir veya en azından daha makul görünebilir.

Let ile ^ ı ve σ 2 bilinmeyen. Z N ( 0 , 1 ) için X = σ Z + μ yazabiliriz .XN(μ,σ2)μσ2X=σZ+μZN(0,1)

Ana İddia : a, ( 1 - α ) için güven aralığı σ 2 q α olan α -seviye miktarsal bir serbestlik derecesine sahip olan bir ki-kare dağılım. Ayrıca, bu aralık μ = 0 olduğunda tam olarak ( 1 - α ) kapsama sahip olduğundan , formun mümkün olan en dar aralığıdır [ 0 , b X 2 )[0,X2/qα)(1α)σ2qαα (1α)μ=0[0,bX2)Bazı .bR,

İyimserlik için bir neden

Hatırlayın o ile durumunda, T = Σ n i = 1 ( X ı - ˉ X ) 2 , tipik bir ( 1 - α ) için güven aralığı σ 2 olduğu ( Tn2T=Σben=1n(Xben-X¯)2 (1α)σ2 Nerede q k , bir olan bir ait -seviye quantile bir ki-kare ile k serbestlik derecesine. Bu, elbette, herhangi tutan u . Buen popüleraralıkolmasına rağmen(açık nedenlerleeşit kuyruklu aralık olarakadlandırılır), ne tek ne de en küçük genişlikte olandır! Görüleceği gibi, başka bir geçerli seçim: ( 0 , T

(Tqn1,(1α)/2,Tqn1,α/2),
qk,aakμ
(0,Tqn1,α).

Zira , , sonra ( 0 , n i = 1 X 2 iTi=1nXi2 Aynı zamanda en azından bir kapsama sahiptir ( 1 - a ) .

(0,i=1nXi2qn1,α),
(1α)

Bu ışıkta bakıldığında, ana iddiadaki aralığın için doğru olduğu konusunda iyimser olabiliriz . Temel fark, tek bir gözlem için sıfır derece serbestlik dereceli ki-kare dağılımının olmamasıdır, bu nedenle bir serbestlik dereceli kuantile kullanmanın işe yarayacağını ummalıyız.n=1

Hedefimize doğru yarım adım ( Sağ kuyruğun kullanılması )

Ana iddianın bir kanıtına dalmadan önce, ilk önce neredeyse hiç istatistiksel olarak güçlü ya da tatmin edici olmayan bir ön talebe bakalım, ancak neler olup bittiğine dair ek bir fikir verelim. Çok fazla (varsa) zarar vermeden, aşağıdaki ana talebin ispatına atlayabilirsiniz. Bu bölümde ve bir sonraki bölümde, kanıtlar - biraz ince olsa da - sadece temel gerçeklere dayanıyor: olasılıkların tekdüzeliği ve normal dağılımın simetrisi ve tekdüzeliği.

Yardımcı iddia : a, ( 1 - α ) için güven aralığı σ 2 uzun gibi a > 1 / 2 . Burada z α , standart bir normalin α- seviye kuantilidir.[0,X2/zα2)(1α)σ2α>1/2zαα

Kanıt . ve | σ Z + μ | d = | - σ Z + μ | böylece daha sonra gelende simetri, biz alabilir u 0 genelliği kaybetmeden. Şimdi, θ 0 ve μ 0 için , P ( | X | > θ ) P ( X > θ )|X|=|X||σZ+μ|=d|σZ+μ|μ0θ0μ0 Ve dolayısıyla bu θ = Z α σ görürüz P ( 0 σ 2 < x 2 / z 2 α ) 1 - α

P(|X|>θ)P(X>θ)=P(σZ+μ>θ)P(Z>θ/σ),
θ=zασ Bu yalnızca için çalışır a'dan > 1 / 2 olduğu için gerekeni olduğundan, z α > 0 .
P(0σ2<X2/zα2)1α.
α>1/2zα>0

Bu yardımcı iddia kanıtlıyor. Açıklayıcı olsa da, çalışmak için saçma bir büyük gerektirdiğinden, istatistiksel açıdan tatmin edici değildir .α

Ana iddiayı kanıtlamak

Yukarıdaki argümanın iyileştirilmesi, keyfi bir güven düzeyi için işe yarayacak bir sonuca yol açar. Öncelikle, P ( | X | > θ ) = P ( | Z + μ / σ | > θ / σ ) olduğuna dikkat edin. Takım , bir = μ / σ 0 ve b = θ / σ 0 . Sonra, P ( | Z + a | > b ) = Φ ( a - b ) + Φ ( - a - b )

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0 Biz sağ taraftaki artar gösterebilirse bir her sabit için b , o zaman önceki argüman benzer bir argüman kullanabilir. Bu en azından akla yatkın, çünkü ortalamanın artması durumunda b'yi aşan bir modüllü bir değer görmemizin daha muhtemel hale geldiğine inanmak istiyoruz. (Ancak, sol kuyrukta kütlenin ne kadar çabuk azaldığına dikkat etmeliyiz!)
P(|Z+a|>b)=Φ(ab)+Φ(ab).
abb

fb(a)=Φ(ab)+Φ(ab)

fb(a)=φ(ab)φ(ab)=φ(ab)φ(a+b).
fb(0)=0uφ(u)ua(0,2b)φ(ab)φ(b)=φ(b)
fb(a)0
a0b0

a0b0

P(|Z+a|>b)P(|Z|>b)=2Φ(b).

Bunları çözersek, eğer alırsakθ=qασ

P(X2>qασ2)P(Z2>qα)=1α,

Kapanış notu : Yukarıdaki argümanın dikkatlice okunması, normal dağılımın sadece simetrik ve tek biçimli özelliklerini kullandığını gösterir. Bu nedenle, yaklaşım, simetrik, tek biçimli bir yer ölçeği ailesi, örneğin Cauchy veya Laplace dağılımları gibi tek bir gözlemden güven aralıkları elde etmek için benzer şekilde çalışır.


Vaov! ve Olympiad sınavının kısa sürede öğrencilerin bu tür bir argüman ortaya çıkması bekleniyor?
Dilip Sarwate

1
@Dilip: Hiçbir fikrim yok! Bu Olimpiyat formatını veya çözüm açısından ne beklendiğini bilmiyorum. Bir edebi okumadan Scortchi'nin cevabının kabul edilebilir olacağını düşünüyorum. Daha önemsiz bir çözümle birinin ne kadar uzağa gidebileceğini bulmaya çalışmakla daha çok ilgilenmiştim. Kendi (oldukça az miktarda) keşif cevabında açıklanan aynı düşünce trenini izledi (bir servis yolu ile). Daha iyi bir çözüm bulunma olasılığı oldukça yüksek. :-)
kardinal

Bu, "resmi" çözümden çok daha uzundur, ancak varyansa daha iyi bir bağ koyar, bu yüzden onu "doğru" cevap olarak işaretliyorum. Bazı simülasyon sonuçları ve tartışmaların yanı sıra, aşağıda "resmi" cevabı da yayınladım. Teşekkürler, @cardinal!
Jonathan Christensen,

2
@Jonathan: Teşekkürler. Evet, ispatı biraz daha kısa tutabilirdim. Buradaki katılımcıların geniş bir arka plan yelpazesi nedeniyle, genellikle fazladan (veya belki de aşırı) ayrıntıya düşkün olma eğilimindeyim. :-)
kardinal

12

Takip zamanı! İşte bana verilen çözüm:

Formun güven aralığını oluşturacağız [0,T(X)), nerede T()bazı istatistikler var. Tanım gereği bu, en az% 99 güven düzeyinde olan bir güven aralığı olacaktır.

(μR,)(σ>0)Pμ,σ2(σ2>T(X))<0.01.
Biz yoğunluğuna dikkat edin N-(μ,σ2) dağıtım aşılmaz 1/σ2π. Bu nedenle,P(|X|a)a/σ for every a0. It follows that
tP(|X|/σt)=P(X2t2σ2)=P(σ2X2/t2).
Plugging in t=0.01 we obtain that the appropriate statistic is T(X)=10000X2.

The confidence interval (which is very wide) is slightly conservative in simulation, with no empirical coverage (in 100,000 simulations) lower than 99.15% as I varied the CV over many orders of magnitude.

For comparison, I also simulated cardinal's confidence interval. I should note that cardinal's interval is quite a bit narrower--in the 99% case, his ends up being up to about 6300X2, as opposed to the 10000X2 in the provided solution. Empirical coverage is right at the nominal level, again over many orders of magnitude for the CV. So his interval definitely wins.

I haven't had time to look carefully at the paper Max posted, but I do plan to look at that and may add some comments regarding it later (i.e., no sooner than a week). That paper claims a 99% confidence interval of (0,4900X2), which has empirical coverage slightly lower (about 98.85%) than the nominal coverage for large CVs in my brief simulations.


1
(+1) That's a nice solution. Should you have t instead of t in the display equation?
kardinal

2
A couple more points: Your solution can be made to be very close to mine without any change in the argument. Note that you can claim that P(|X|a)2a/σ2π. Then the interval becomes (0,2X2/πα2) for any α. Using α=0.01 yields T(X)6366.198X2 versus the 1/q0.016365.864 in my answer. The higher the confidence level (i.e., the smaller the α), the closer your method compares to mine (though your interval will always be wider).
kardinal

1
İkincisi, o makaleye bakmadım, ancak bu konuda şüphelerim var. (0,4900X2)geçerli bir% 99 güven aralığı olabilir. Aslında, formun tüm güven aralıklarını göz önünde bulundurun(0,bX2) bazı b. Sonra ne zamanμ=0bizde X2/σ2 tam olarak bir derece serbestlikle ki kare, yani en küçük b bu durumda seçebiliriz b=1/qα. Başka bir deyişle, cevabımda verilen aralık belirtilen formun mümkün olan en darıdır.
kardinal

1
(Şüpheli) yazım hatası düzeltmesini yaptım. Ayrıca, pchisq(1/4900,1,lower.tail=F)içinde Riadeler 0.9886, oldukça yakın Simülasyonunuzda sonuçlarına ilişkin(0,4900X2) Aralık.
kardinal

1
Tüm yorumlar için teşekkürler, @ cardinal. Sanırım değişimin doğru, orijinal çözümlerde olduğu gibi yazmış olmama rağmen - orada yazım hatası, sanırım.
Jonathan Christensen,

5

CI'ler (0,) muhtemelen.


1
I think it would be helpful for you to say why you can't get a finite length confidence interval.
Aralık'ta

1
@ Max yeterince akıllı değilim - ama soru bir tane istemedi.
Scortchi - Monica'yı yeniden yerleştirin

4
Bunun için +1. Soru, en az kapsama sahip bir CI demiyordu ve aslında bunun meraklı ifadesiyle, " en az % 99 güven düzeyinde bir güven aralığı" ile kabul edilebilir olabileceği anlamına geliyor .
Ari B. Friedman,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.