Normal dağılımdan örnek standart sapmasının standart sapmasını nasıl bulabilirim?


11

Çok bariz bir şeyi kaçırırsam affet beni.

Ben aslında normal dağılıma yakın bir ortalama değer etrafında merkezli bir (histogram) dağılımı olan bir fizikçiyim. Benim için önemli olan değer, bu Gauss rasgele değişkeninin standart sapmasıdır. Örnek standart sapmadaki hatayı bulmaya nasıl çalışabilirim? Orijinal histogramdaki her bölmedeki hatayla ilgili bir şey olduğunu hissediyorum.


Stats.stackexchange.com/questions/26924 adresinde bir ipucu verilmiştir . Genel olarak, bir varyansın örnekleme hatası , dağılımın ilk dört anı cinsinden hesaplanabilir ve bu nedenle SD'nin örnekleme hatası en azından bu anlardan tahmin edilebilir.
whuber

Yanıtlar:


12

Örnek standart sapmanın standart sapmasının hesaplanmasını istiyormuşsunuz gibi görünüyor. Yani, istersiniz , buradaSD(s)=var(s)

s=1n1i=1n(XiX¯),

¯ XX1,...,XnN(μ,σ2) ve örnek ortalamasıdır.X¯

İlk olarak, varyansın temel özelliklerinden

var(s)=E(s2)E(s)2

Örnek varyansı tarafsız olduğu için olduğunu biliyoruz . In Why numune standart sapma bir yanlı kestiricisi olduğu ? , hesaplanır, buradan çıkarabilirizσ E ( s )E(s2)=σ2σE(s)

E(s)2=2σ2n1(Γ(n/2)Γ(n12))2

bu nedenle

SD(s)=E(s2)E(s)2=σ12n1(Γ(n/2)Γ(n12))2

İyi bir nokta. S ^ 2 varyansına dair bir tahmin aldım. Karekök almak s ^ 2'nin standart sapmasının bir tahminini verir. Ama s'nin standart sapmasını elde etmek için asıl soruyu cevapladınız. Pratik nedenlerden ötürü, formülü kullanarak bir tahmin almak için σ yerine s koyacağınızı varsayıyorum.
Michael R.Chernick

Evet, doğru, ile değiştirebilirsiniz ve bu yaklaşım, mütevazı örnek boyutları için bile iyi performans gösterir - ile bazı testler yaptım . s n = 20σsn=20
Makro

11

Miktarı ile ki-kare dağılımı vardır serbestlik derecesi örnekleri bağımsız ve bu miktar güven almak için kullanılabilir, aynı normal dağılım ile bir şekilde dağıtıldıklarında, normalin ve standart sapmasının varyans aralıkları. Sadece bidonların merkezi değerine değil, ham değerlerine sahipseniz, değerini hesaplayabilirsiniz . n - 1 s 2X=(n1)s2/σ2n1s2

serbestlik derecesinde ki-kare dağılımına sahip olması durumunda varyansının olduğu bilinmektedir . Bunu ve gerçeğini bilerek , eşit bir varyansı olduğunu görüyoruz Her ne kadar bilinmemektedir sen bunu tahmin edebilirsiniz ve varyansı kabaca fikir sahibi olduğunu.n - 1 2 ( n - 1 ) V a r ( c X ) = c 2 V a r ( X ) s 2 2 ( n - 1 ) σ 4Xn12(n1)Var(cX)=c2Var(X)s2σ 4 s 4 s 2

2(n1)σ4(n1)2=2σ4n1.
σ4s4s2

Ben başlangıçta bu post olacaktı, ama burada gördüğüm sorun bilinmeyen olmasıdır. Bu gerçek göz önüne alındığında , örnek boyutunu bile bilmiyorsak yaklaşık olup olmadığını bilmiyorum. Dördüncü anın aykırı değerlerde ciddi sorunları olabileceğini gösterebileceğimi hatırlıyorum. s 4σ 4σ2s4σ4
Néstor

σ 4 σ 4s4 , için tutarlı bir tahmin edicidir (sağlanan mevcutsa), doğru @Nesp? Bu genellikle insanlar "yaklaşık" veya "kaba fikir" dediğinde kastedilen şey olduğunu düşünüyorum. σ4σ4
Makro

2
Belki uyku eksikliği, ama bu dairesel akıl yürütme gibi değil mi?
Néstor

Başlangıçtan itibaren verilerin normal bir dağılımdan geldiğini varsaydık, bu nedenle daha fazla bir sorun yok. Macro'un önerdiği şekilde kaba demek istedim. Numune boyutunun s ^ 4'ün σ ^ 4'e ne kadar yakın olduğunu etkilediğini kabul ediyorum. Ancak aykırı değerlerin kaygısı, Nesp'in dışındadır. Beni bunun için düşürdüysen bence çok haksızlık. Sunulan, veriler NORMAL OLARAK DAĞITILDIĞINDA s ^ 2 için standart sapmayı tahmin etmenin standart yoluydu.
Michael R. Chernick

@Nesp, Michael, normal olarak dağıtılmış bir örnekten örnek standart sapmasının varyansının tutarlı bir tahmincisini verdi - büyük örnekler için iyi yapacaktır - simüle edip öğrenecektir. Bunun neden dairesel akıl yürütme olduğunu düşündüğünüzden emin değilim.
Makro

7

Normal durumda standart sapma hatasını ölçmenin birkaç yolu vardır. Güven aralıklarını tahmin etmek için kullanılabilecek profil olasılığını sunacağım .σ

Let bir Normal bir örnek olmak . Karşılıklı olabilirlik fonksiyonu,( μ , σ )x=(x1,...,xn)(μ,σ)

L(μ,σ)1σnexp(12σ2j=1n(xjμ)2)

Ardından, Maksimum Olabilirlik Tahmin Edicileri ; burada . hatayı ölçmekle ilgilendiğiniz , bu parametrenin normalleştirilmiş profil olasılığını aşağıdaki gibi hesaplayabilirsiniz.(μ^,σ^)=(x¯,s)s=1nj=1n(xjx¯)2σ

Rp(σ)=supμL(μ,σ)L(μ^,σ^)=(σ^σ)nexp[n2(1(σ^σ)2)]

Not o seviyede bir aralık. yaklaşık bir güven vardır Sonraki Bir ekleyin. bu aralıkları hesaplamak için kullanılabilecek kod Sen değiştirebilirsiniz. bağlamınıza göre (veya verileri gönderirseniz bu değişiklikleri ekleyebilirim).0.147 0,95 RRp:R+(0,1]0.1470.95R

data = rnorm(30)
n = length(data)
sg = sqrt(mean((data-mean(data))^2))
# Profile likelihood
rp = function(sigma) return( (sg/sigma)^n*exp(0.5*n*(1-(sg/sigma)^2))  )
vec = rvec = seq(0.5,1.5,0.01)
for(i in 1:length(rvec)) rvec[i] = rp(vec[i])
plot(vec,rvec,type="l")
rpc = function(sigma) return(rp(sigma)-0.147)
# Approximate 95% confidence interval
c(uniroot(rpc,c(0.7,0.8))$root,uniroot(rpc,c(1.1,1.3))$root)

Bu tür aralıkların bir avantajı, dönüşümler altında değişmez olmalarıdır. Bu durumda , için bir aralık hesaplarsanız , için karşılık gelen aralık basitçe .I = ( L , U ) σ 2 I = ( L 2 , U 2 )σI=(L,U)σ2I=(L2,U2)


Bence gerçekten s'nin standart sapmasını istiyordu.
Michael R.Chickick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.