Standart sapma standart sapması


54

Verinin normalliği varsayılabilirse, standart sapmanın standart sapmasının tahmincisi nedir?


Örneklem varyansının dağılımını aradığınızı varsayalım . Bu, Vikipedi sayfasında 16:55, 21 Ağustos 2016 tarihindeki değişiklik hakkında bir bölüme bağlantı vermektedir. Bu Vikipedi'ye bir bağlantı olduğundan, makale gelecekte değişebilir. Bu nedenle, bölüm bu cevabın bu değişikliklerden sonra değindiği içerikleri yansıtmayabilir. Bu nedenle, Wikipedia sayfasının tarihsel bir versiyonunun bağlantısı burada verilmiştir. Varyans hakkındaki güncel makale [burada] bulunur ( en.wikipedia.org/wik

Yanıtlar:


58

Let . Bu iş parçacığında gösterildiği gibi , örnek standart sapmanın standart sapması,X1,...,XnN(μ,σ2)

s=1n1i=1n(XiX¯),

dır-dir

SD(s)=E([E(s)s]2)=σ12n1(Γ(n/2)Γ(n12))2

burada olan gamma fonksiyonu , numune boyutu ve olan örnek anlamına edilir. Yana tutarlı bir tahmin olup bu değiştirilmesi anlaşılacağı ile tutarlı bir tahmincisi elde etmek için, yukarıdaki denklemde .n ¯ X = 1Γ()nsσσsSD(lar)X¯=1ni=1nXisσσsSD(s)

Aradığınız tarafsız bir tahminci ise , bu başlıkta olduğunu görüyoruz . , yani beklentinin doğrusallığı ileE(s)=σ2n1Γ(n/2)Γ(n12)

sn12Γ(n12)Γ(n/2)

tarafsız bir tahmincisi olarak . Bütün bunlar beklentinin doğrusallığı ile birlikte, tarafsız bir tahmincisini verir : S D ( ler )σSD(s)

sΓ(n12)Γ(n/2)n12(Γ(n/2)Γ(n12))2

12
+1 Neredeyse iki yıl sonra ortaya çıkacak daha iyi bir cevap değil, aynı zamanda bu konudaki referanslardan daha kullanışlı detaylar veren bir cevap görmek güzel.
whuber

2
Mesafeleri ilk formüldeki kareye çevirmeyi unuttun mu?
danijar

2
Gama fonksiyonu küçük olmayan değerlerini hesaplamak zordur . Stirling'in yaklaşımını uygulayarak , hesaplamanın yanı sıra biraz da uygun olan alıyorum daha kompakt ifade şeklinde. s nse(11n)n11
Kasım’da

1
Muhtemelen s 'nin (@
Macro’nun cevabında

Basit bir form isteyenler için, yüzde birkaç seviyede iyi bir yaklaşımdır. s/2(n1)
Syrtis Major

5

Normal sıfırdan X_nid kimliklerini gözlemlediğinizi varsayalım ve varyansı . (Empirik) standart sapma tahmin kareköküdür arasında (tarafsız veya bu soru değildir). Bir tahmin edici olarak ( ile elde edilir ), teorik olarak hesaplanabilecek bir varyansa sahiptir. Belki de standart sapmanın standart sapması dediğiniz şey aslında standart sapmanın varyansının kareköküdür, yani ? Bir tahmin edici değil, teorik bir miktardır ( gibi bir şeyσ 2 σ 2 σ 2 x 1 , ... , X n σX1,,Xnσ2σ^2σ2X1,,Xnσ^ σ/E[(σσ^)2]σ/n (teyit edilecek) açıkça hesaplanabilir!


Bu, tahmin edicinin bir işlevi hala tahmin edici değil midir? Hala bilmiyorum \ sigma, sadece X_i.

tamam, o zaman muhtemelen varyansın karekökü tahmininin varyansının karekökünü tahmin edersiniz ... doğru :) gibi bir şey olmalı mı? σ^/n
robin girard

Srikant'ın buldukları (ve PhysicsForums'ta neyin teyit edildiği gibi) olmalı , bunun yerine . σ2σ^22n

1
Aww, bu yorumlar kilitler; . En azından bu bir sonucu bootstrap ile anlaşarak verir. σ^2n

-3

@ Macro hesaplamak için denklemi ile büyük bir matematiksel açıklama sağladı. Daha az matematik insan için daha genel bir açıklama.

Bence "SD'nin SD'si" terminolojisinin kafa karıştırıcı olduğunu düşünüyorum. Bir SD'nin güven aralığını düşünmek daha kolaydır. Bir örnekten hesapladığınız standart sapma ne kadar kesindir? Şans eseri bir araya toplanmış veriler elde etmiş olabilirsiniz, bu da örnek SD'yi popülasyon SD'sinden çok daha düşük yapar. Veya, numune popülasyonunu SD popülasyonundan daha yüksek yapan, genel popülasyondan çok daha dağınık olan rastgele elde edilmiş değerler almış olabilirsiniz.

SD'nin CI'sini yorumlamak basittir. Verilerinizin rastgele ve bağımsız olarak bir Gauss dağılımından örneklenmiş olduğu varsayımına alışın. Şimdi bu örneklemeyi birçok kez tekrarlayın. Bu güven aralıklarının% 95'inin gerçek nüfus SD'sini içermesini bekliyorsunuz.

Bir SD'nin% 95 güven aralığı ne kadar geniş? Tabii ki numune büyüklüğüne (n) bağlıdır.

n:% 95 CI SD

2: 0.45 * SD ila 31.9 * SD

3: 0.52 * SD ila 6.29 * SD

5: 0.60 * SD ila 2.87 * SD

10: 0.69 * SD - 1.83 * SD

25: 0.78 * SD ila 1.39 * SD

50: 0.84 * SD ila 1.25 * SD

100: 0.88 * SD ila 1.16 * SD

500: 0.94 * SD ila 1.07 * SD

Ücretsiz web hesap makinesi


Monte Carlo'yu yapabilirim, sadece daha 'bilimle' bir şekilde yapmak istedim; Yine de dağılımın normal olmadığı konusunda haklısın, bu yüzden sd test için faydasız olacak.

4
Buna değer, "% 95 olan ... gerçek SD'yi içermesi muhtemel bir güven aralığı" (veya bağlantılı sayfada daha açık bir şekilde belirtildiği gibi) ifadesinden rahatsızlık duyuyorum: " Örnek SD'den hesaplanan CI, gerçek popülasyon SD'sini içerir "". Bence bu ifadeler popüler bir yanılgıyı pekiştiriyor / artıyor , örneğin CV ile ilgili bir tartışma için buraya bakınız .
gung - Monica’yı yeniden kurun

5
"Sanırım" SD SD'nin kavramı ve terminolojisinin "başa çıkamayacak kadar kaygan olduğunu" düşünüyorum? Örnek standart sapma, standart sapma olan rastgele bir değişkendir.
Makro

@Makro. Yorumlarınız için teşekkürler. Ben esasen yeniden yazdım.
Harvey Motulsky

1
@gung. Güven aralığını doğru şekilde açıklamak için yeniden yazdım.
Harvey Motulsky
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.