Standart sapma formülünde “N” örnek sayısı için karekök neden alınır?


9

Çok temel bir standart sapma kavramını anlamaya çalışıyorum.

Formül kaynaktanσ=i=1n(xiμ)2N

Niçin "N" popülasyonunu yarıya indirmemiz gerektiğini anlamıyorum, yani {N ^ 2} yapmadığımızda neden \ sqrt {N} almak istiyoruz ? Bu düşündüğümüz nüfusu çarpıtmıyor mu?NN2

Formül olmamalı σ=i=1n(xiμ)2N

Yanıtlar:


10

Ortalamadan "tipik" bir sapma bulmaya çalışıyorsunuz.

Varyans "ortalamadan ortalama kare mesafe" dir.

Standart sapma bunun kare köküdür.

Bu onu ortalamadan kök-ortalama-kare sapması yapar .

  1. Neden ortalama kare sapmayı kullanalım? Varyansı ilginç yapan nedir? Diğer şeylerin yanı sıra, varyanslar hakkında temel bir gerçek nedeniyle - ilişkisiz değişkenlerin toplamının varyansı, bireysel varyansların toplamıdır. (Bu, örneğin burada CrossValidated ile ilgili bir dizi soruda ele alınmıştır. Bu kullanışlı özellik, örneğin ortalama mutlak sapma ile paylaşılmaz.
  2. Neden bunun karekökünü almalıyız? Çünkü o zaman orijinal gözlemlerle aynı birimlerdedir. Ortalamadan belirli bir tür 'tipik mesafeyi' (belirtildiği gibi, RMS mesafesi) ölçer - ancak yukarıdaki varyans özelliği nedeniyle - bazı güzel özelliklere sahiptir.

7

Standart sapma kare köküdür Varyans .

Varyans, verilerin ortalamadan ortalama kare mesafesidir. Bir ortalamanın, toplanan öğelerin sayısına bölünmesiyle, varyans için formül şu şekildedir: Yine standart sapma sadece bunun karekökü olduğundan, standart sapmanın formülü: hiçbir şey eklenmedi veya değiştirilmedi varsayımlar veya buradaki varyans, sadece varyansın kare kökünü aldık, çünkü standart sapma budur .

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N

belki de bu varyans formülünün sadece ayrık üniformalar için geçerli olduğu belirtilmelidir. aksi taktirde örneklem ve popülasyon varyansı arasındaki farkı karıştırabilir
Taylor

@Taylor, ne demek istediğini bilmiyorum. Varyans formülü dağılımla ilgisizdir.
gung - Monica'yı eski

(örnek) varyans formülü dağılımla ilgisizdir ( en.wikipedia.org/wiki/Expected_value#Definition )
Taylor

@Taylor, ne demek istediğini hala bilmiyorum. Varyans formülü dağılımla ilgisizdir. Wikipedia sayfasından alıntı yapmak için, "Rastgele bir değişkenin varyansı, X, X ... den kare sapmanın beklenen değeridir. . Bu tanım, kesikli, sürekli, ne ya da karışık işlemler ile oluşturulan rasgele değişkenleri de kapsar." Formül sadece ayrık üniforma için geçerli değildir. Var(X)=E[(Xμ)2]
gung - Monica'yı eski

Evet, doğru, alırsanız , ancak , herhangi bir rastgele değişken için , . Birincisi, birincisi bir sabit, ikincisi rastgele. Aslında toplamın desteğini mi yoksa örnek sayısını mı aştığı belli değil . İkincisi, pratikte nadir olan bilmeniz tuhaftır . Birincisi, o zaman evet, sadece ayrık (çünkü bir toplam) üniformalar için geçerlidir (çünkü ağırlıkların hepsi tekdüzedir). μ=EXE[(Xμ)2]X1Ni(xiμ)2Xμ
Taylor

1

Anlaşılması gereken ilk şey, standart sapmanın (std) ortalama mutlak sapmadan farklı olduğudur . Bu ikisi verilerle ilgili farklı matematiksel özellikleri tanımlar.

Ortalama mutlak sapmanın aksine, standart sapma (std) ortalamadan uzak olan değerlere daha fazla ağırlık verir, bu da fark değerlerinin karesi alınarak yapılır.

Örneğin, Dört veri noktasını takip etmek için:

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

ortalama mutlak sapma (aad) ve=16/4=4.0

Standart sapma (std) =80/4=20=4.47

Verilerde, ortalamadan 6 mesafe olan iki nokta ve ortalamadan 2 mesafe olan iki nokta vardır. Yani, 4.47'deki sapma 4'ten daha mantıklıdır.

Toplam gözlem her zaman , std hesaplaması için dalış yapmıyoruz , bunun yerine toplam varyansı bölüyoruz ve orijinal verileriyle aynı birime getirmek için karekökünü alıyoruz.NNN


0

@Mahesh Subramaniya - Bu sadece matematiksel bir bükülme . gibi orijinal değere sahip olduğumuzda . ve bu iki denklemi kullanarak aynı değeri elde edebiliriz .a/b=()da2b=ccb=d

Örneğin, = . Ancak, sadece eksi değil değer istiyoruz.522.5

Şimdi, . Ve522=12.512.52=2.5

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.