Standart sapma kullanımı normal dağılım varsayımı üzerine inşa edilmiş mi?


10

Standart sapmanın her zaman normal dağılım varsayımı üzerine inşa edilip edilmediğini merak ediyorum. Başka bir deyişle, örnek normal olarak dağıtılmamışsa, standart sapmayı kullanmak bir hata olarak mı değerlendirilmelidir?


3
Düzgün bir dağılımın standart sapması vardır, bu nasıl bir "hata" olabilir?

Yanıtlar:


18

Hayır. Standart sapmanın kullanılması normalliği kabul etmez.

Rastgele bir değişkenin varyansı şu şekilde tanımlanır: var(X)=E[(X-E[X])2]. Varyans olduğu sürece, standart sapma da vardır. Standart sapma varyansın kare köküdür.

Varyansı kullanabilirsiniz var(X)veya her ikisinin mevcut olduğu her zaman standart sapma. Varyans sayısız durumda ortaya çıkıyor.

Özel teoremler, lemmalar vb. Vardır. X normal dağılımı izler.

Normalliğe bağlı olan standart sapmanın yaygın kullanımı:

Eğer X normal dağılımı izler, sonra yaklaşık% 95 olasılık vardır. X ortalamanın iki standart sapması içerisindedir.

Bu ifade şu durumlarda doğrudur: X normal dağılımı (ve birkaçını) takip eder, ancak genel olarak doğru değildir.

Normalliğe bağlı olmayan varyansın ortak kullanımı :

İzin Vermek X ortalama ile rastgele değişken olmak E[X]=μ ve varyans var(X)=σ2. TanımlamakXben için ben=1,...,n bağımsız rasgele değişkenler olarak X.

Örnek ortalamayı n gözlemler şöyle:

X¯n=1nΣben=1nXben

Merkezi Limit Teoremi ile, X¯n ortalama olarak normal dağılıma sahip rastgele bir değişkene yaklaşır μ ve varyans σ2n. (Daha kesinn(X¯n-μ) dağıtımda yakınsar N-(0,σ2) gibi n.)

Pratik ima örnek ortalama X¯n büyük için n varyansı normal olarak dağıtılmış rasgele değişken olarak değerlendirilebilir σ2n bir varyansın fonksiyonudur X. (Hatırlamavar(X)=σ2.) Ve bu sonuç gerektirmez XNormal olmak. (Daha düşük birn eğer iyi çalışırsa X olsa da bir anlamda normal dağılıma daha yakındır.)

Merkezi Limit Teoremi, varyansını kullanan her yerde bulunan bir araçtır. X ve gerek yok X normal dağılımı takip etmek.


4
Chebyshev Eşitsizliği varyansa özgü değildir: gücü mutlak olan her mutlak an için eşit derecede yararlı bir versiyon mevcuttur 1. Bu nedenle, SD'nin neden önemli ve (neredeyse) evrensel olduğu, örneğin Merkezi Limit Teoreminde varyansın oynadığı eşsiz rol gibi başka yerlere bakmanızı öneririm .
whuber

@whuber Evet, bir CLT örneği yazmaya başlamıştım (ve şimdi ekledim). CLT, varyansı önemsemek için son derece pratik bir nedendir.
Matthew Gunn

1
+1. Ancak, varyans (ortalama ile birlikte) normal durumda tam bir açıklama verirken, normal olmayan dağıtım için bu artık geçerli olmayabilir ve verilerin diğer d3 kodlayıcıları çok daha iyi olabilir
kjetil b halvorsen

2

Standart IID ayarında, uygun düzenlilik koşulları altında, S2 (Hem de σ^ML2), Vbirr[Xben]. Bu doğrudan Büyük Sayıların Güçlü Yasası'ndan gelir. Normal bir model varsayımı gerekli değildir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.