Hızlı cevap
Bunun nedeni, verilerin iid ve olduğu ve
ˉ XXi∼N(μ,σ2)
güven aralıkları oluştururken, numune varyansı ile ilişkili örnekleme dağılımı (S2, hatırlayın, rastgele bir değişken!) Ki-kare dağılımı (S2(N-1)/σ2∼χ2n-1), örnek ortalamasıyla ilişkili örnekleme dağılımı standart normal dağılım olduğu gibi ((ˉX-μ)√
X¯S2==∑NXiN∑N(X¯−Xi)2N−1
S2S2(N−1)/σ2∼χ2n−1) varyansı bildiğinizde ve bilmediğinizde bir t öğrencisi ile (
( ˉ X -μ) √(X¯−μ)n−−√/σ∼Z(0,1) ).
(X¯−μ)n−−√/S∼Tn−1
Uzun cevap
Her şeyden önce, N - 1 ile ki-kare dağılımını takip ettiğini kanıtlayacağız.S2(N−1)/σ2N−1 serbestlik dereceli . Bundan sonra, varyansın güven aralıklarını elde ederken bu kanıtın nasıl yararlı olduğunu ve ki-kare dağılımının nasıl göründüğünü (ve neden bu kadar yararlı olduğunu!) Göreceğiz. Hadi başlayalım.
Kanıt
Bunun için belki de bu Wikipedia makalesinde ki-kare dağılımına alışmanız gerekir . Bu dağılımın sadece bir parametresi vardır: serbestlik derecesi, ve şu şekilde verilen bir Moment Üretme Fonksiyonuna (MGF) sahiptir:
m χ 2 ν ( t ) = ( 1 - 2 t ) - ν / 2 . S 2 ( N - 1 ) / σ 2
dağılımının bunun gibi bir moment üretme fonksiyonuna sahip olduğunu gösterebilirsek , ancak ν =ν
mχ2ν(t)=(1−2t)−ν/2.
S2(N−1)/σ2 , sonra
S 2 ( N - 1 ) / σ 2'nin N - 1 serbestlik derecesinesahip bir ki-kare dağılımını izlediğini gösterdik. Bunu göstermek için iki gerçeği not edin:
ν=N−1S2(N−1)/σ2N−1
Tanımlarsak ,
buradaZ,ı~, N(0,1), örneğin, standart normal rasgele değişkenler, momenti üreten fonksiyonYile verilir
m Y (t)
Y=∑(Xi−X¯)2σ2=∑Z2i,
Zi∼N(0,1)Y
Arasında MGFZ2ile verilir
m Z 2 ( t )mY(t)===E[etY]E[etZ21]×E[etZ22]×...E[etZ2N]mZ2i(t)×mZ22(t)×...mZ2N(t).
Z2
I, standart normal, PDF kullandıkf(Z)=E- z 2 / 2/√mZ2(t)==∫∞−∞f(z)exp(tz2)dz(1−2t)−1/2,
ve dolayısıyla
mY(t)=(1-2t) - N / 2 ,
budaY'ninNserbestlik derecelibir ki-kare dağılımını izlediğini gösterir.f(z)=e−z2/2/2π−−√mY(t)=(1−2t)−N/2,
YN
Y1Y2ν1ν2W=Y1+Y2ν1+ν2W
N−1
(N−1)S2=−n(X¯−μ)+∑(Xi−μ)2,
σ2(N−1)S2σ2+(X¯−μ)2σ2/N=∑(Xi−μ)2σ2.
NS2(N−1)/σ2N−1 .
Varyans için Güven Aralıkının hesaplanması.
L1L2
P(L1≤σ2≤L2)=1−α.
S2(N−1)L1S2(N−1)≤σ2S2(N−1)≤L2S2(N−1).
And then remember two things: (1) the statistic
S2(N−1)/σ2 has a chi-squared distribution with
N−1 degrees of freedom and (2) the variances is always greather than zero, which implies that you can invert the inequalities, because
L1S2(N−1)≤σ2S2(N−1)σ2S2(N−1)≤L2S2(N−1)⇒⇒S2(N−1)σ2≤S2(N−1)L1,S2(N−1)L2≤S2(N−1)σ2,
hence, the probability we are looking for is:
P(S2(N−1)L2≤S2(N−1)σ2≤S2(N−1)L1)=1−α.
Note that
S2(N−1)/σ2∼χ2(N−1). We want then,
∫N−1S2(N−1)L2pχ2(x)dx∫S2(N−1)L1N−1pχ2(x)dx==(1−α)/2 ,(1−α)/2
(we integrate up to
N−1 because the expected value of a chi-squared random variable with
N−1 degrees of freedom is
N−1) or, equivalently,
∫S2(N−1)L20pχ2(x)dx=α/2,∫∞S2(N−1)L1pχ2(x)dx=α/2.
Calling
χ2α/2=S2(N−1)L2 and
χ21−α/2=S2(N−1)L1, where the values
χ2α/2 and
χ21−α/2 can be found in chi-square tables (in computers mainly!) and solving for
L1 and
L2,
L1L2==S2(N−1)χ21−α/2,S2(N−1)χ2α/2.
Hence, your confidence interval for the variance is
C.I.=(S2(N−1)χ21−α/2,S2(N−1)χ2α/2).