Standart sapma oluşturmak için neden varyansın kökü alıyoruz?


26

Maalesef bu başka bir yerde cevaplandıysa, bulamadım.

Standart sapmayı oluşturmak için neden özellikle de sapmanın karekökünü aldığımızı merak ediyorum. Yararlı bir değer üreten karekök alma konusunda ne?



2
Öklid vektörü normu olarak standart sapmayı ve ardından kare olarak varyansı düşünün. Bu varyans tanımı ve standart sapma faydalı analitik özelliklere sahip.
avukat

Yanıtlar:


44

Bir anlamda bu önemsiz bir sorudur, ancak bir başkasında, aslında oldukça derin!

  • Diğerleri de gibi, karekök alma ima Stdev(X) ile aynı birimleri vardır X .

  • Karekök almak size mutlak homojenlik yani mutlak ölçeklenebilirlik kazandırır . Herhangi bir skalar α ve rasgele X değişkeni için ,

    Stdev[αX]=|α|Stdev[X]
    sahibiz: Stdev [ α X ] = | α | Stdev [ X ] Mutlak homojenlik , bir norm için gerekli bir özelliktir . Standart sapma olduğu benzer bir şekilde (ortalama sıfır rastgele değişkenlerin vektör bir alan) bir norm olarak yorumlanabilir x2+y2+z2 , üç boyutlu uzayda standart Euclidian normudur. Standart sapma, rastgele bir değişken ve onun ortalama arasındaki mesafenin bir ölçüsüdür.

Standart sapma ve L2 normu

Sonlu boyut olgusu:

Bir in n boyutlu vektör alan, diğer adıyla standart Öklid norm L2 norm olarak tanımlanır:

x2=ixi2

Daha geniş, p -norm xp=(Σben|xben|p)1p mutlak homojenliği elde etmek içinpkökünüalır:αxp=(Σben|αxben|p)1p=|α|(Σben|xben|p)1p=|α|xp.

Eğer ağırlık varsa qben sonra ağırlıklı toplamıdır Σbenxben2qben de geçerli bir kuraldır. Ayrıca, eğerqbenolasılıkları veE[x]ixiqi=0ise standart sapmadır.E[x]Σbenxbenqben=0

Sonsuz boyut olgusu:

Sonsuz boyutlu Hilbert Space biz benzer tanımlayabilir L2 normunu :

X2=ωX(ω)2dP(ω)

Eğer X ortalama sıfır rasgele değişken ve P olasılık ölçüsü ise, standart sapma nedir? Aynı: ωX(ω)2dP(ω) .

Özet:

Karekök almak demektir standart sapma tatmin yapar mutlak homojenlik , bir bir norm gerekli özelliğini .

Rastgele değişkenin bir boşluk üzerine X,Y=E[XY] bir bir iç çarpım ve X2=E[X2] , iç ürünün sebep olduğu bir norm. Bu nedenle standart sapma, parçalara

STDEV[X]=X-E[X]2
rasgele bir değişkeninnormudur:Stdev[X]=X-E[X]2 OrtalamaE[X]ilaXarasındaki mesafenin bir ölçüsüdür.

(Teknik nokta: ikenE[X2] bir norm, standart sapmaE[(XE[X])2] bir için bir gereklilik nedeniyle, genel olarak rasgele değişkenler üzerinde bir norm değilnormlu vektör alanıolanx=0ancak ve ancakx=0. 0 standart sapması, rasgele değişkenin sıfır elemanı olduğu anlamına gelmez.)


1
Bu cevap gerçekten konunun tam merkezinde yer almakta ve şu anda kabul edilenden daha bilgilendirici olmaktadır.
00prometheus

26

Varyans olarak tanımlanır V ( X ) = E ( x - D ( x ) ) 2 , bu X ve beklenen değer arasında bir karesi alınmış farkın bir beklenti yani.XV(X)=E(XE(X))2

XXE(X)V(X)seconds2V(X)


Ah, görüyorum ki, farkların karesini hesaplamaktan kaynaklanan, varyans hesaplamasındaki ölçek değişimini geri almak mı?
Dave

11
Doğru - ama boyutlardaki değişim , ölçekte değil.
Jean-François Corbett

Ama orada tek bir terim olduğu gibi değil: iktidarda 2 olduğunda, her biri diğer terimlerden daha fazla veya daha azını getirdiğinde çok fazla ve her biri vardır. Fakat karekök aldığımızda, bu farklılığı ihmal ediyoruz, değil mi? İlk numarayı almazdık, bütün farklılıkların toplamı bu şekilde. Her bir terimin karekökünü almak daha iyi olmaz mıydı?
parsecer

V^i=1n(xix¯)=i=1nxii=1nxi=0

bir2=|bir|bir

6

Basit cevap, birimlerin ortalama ile aynı ölçekte olmasıdır. Örnek: Ortaokul öğrencisi için ortalamanın 20 cm standart sapma (SD) ile 160 cm olduğunu tahmin ediyorum. SD ile olan değişimi anlamak , sezgisel olarak 400 cm ^ 2 değişkeninden daha kolaydır.


0

Daha basit bir ifadeyle standart sapma, bize verilerimizin ortalamaya yayılmasıyla ilgili bir şeyler söyleyen pozitif bir sayı vermek için tasarlanmıştır.

Tüm noktaların uzaklıklarını ortalamanın sadece toplamına eklersek, pozitif ve negatif yönlerdeki noktalar ortama doğru geri çekilecek şekilde birleşir ve dağılım hakkında bilgi kaybederiz. Bu nedenle ilk önce varyansı ölçüyoruz, böylece tüm mesafeler kareler yoluyla pozitif miktarlar olarak korunur ve birbirlerini iptal etmezler. Sonunda, başladığımız birimleri temsil eden pozitif bir değer istiyoruz - bu zaten yukarıda yorumlandı - bu yüzden pozitif karekökü alıyoruz.


-3

Entelektüel tembellik nedeniyle devam ettiğimiz tarihi bir aptallık. Eksi işaretinden kurtulmak için ortalamadan farkları belirlemeyi seçtiler. Sonra, karekökü aldılar ve ortalamaya benzer bir ölçeğe getirdiler.

Birisi ortalamadan sapma modül veya mutlak sapma değerleri kullanarak yeni istatistikler, hesaplama varyansı ve SD üretmelidir. Bu, bütün bu karelerden kurtulur ve daha sonra karekök işini yapar.


1
Zaten, ortalama (ya da ortanca) mutlak sapma, L1 normları ve benzerleri şeklinde buna sahibiz. Bununla birlikte, geleneksel yaklaşımın en büyük avantajı, mutlak değerlerin aksine, farklılaştırılabilir niteliktedir; bu, şeyleri analitik olarak küçültmenizi ve en üst düzeye çıkarmanızı sağlar.
Matt Krause,

1
Duruşunuz için temel bir gerekçe sunmakta başarısız olursunuz, lütfen açıkça ortaya konulan bir matematik argümanı sağlayın. Mutlak değerlerin toplamı, kareler toplamının kareköküne çok farklı ölçeklenir. İkincisi, faydalı bir özellik olan aşırı değerlerin katkısını vurgular. Ayrıca, SSQ en küçük kareler analitik yöntemlerinin merkezindedir. Lütfen SD'nin sorunlarını ve alternatiflerin nasıl karşılaştırıldığını, okuyucunun bakış açınızı anlamasını sağlamak için zaman ayırın. .
ReneBt

(-1) "Tarihsel aptallık" ve "entelektüel tembellik" gibi ifadeleri öz-referans olarak okumak çok kolay.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.