Standart sapma neden N'ye göre kareler toplamının sqrt'ı olarak değil, varyansın sqrt'ı olarak tanımlanıyor?


16

Bugün bir giriş istatistik dersi verdim ve bir öğrenci bana şu şekilde yeniden sorduğum bir soru ile geldi: "Standart sapma neden N üzerindeki karelerin toplamı sqrt olarak değil, varyans sql olarak tanımlanıyor?"

Nüfus varyansını tanımlarız: σ2=1N(xiμ)2

Ve standart sapma: σ=σ2=1N(xiμ)2 .

Σ ' ya verebileceğimiz yorumσ , popülasyondaki birimlerin X popülasyon ortalamasından ortalama sapmasını vermesidir.X .

Ancak, sd tanımında kareler toplamının sqrt'ını N . Öğrencinin gündeme getirdiği soru, neden kareler karesinin karesiniNyerinebölmüyoruz. Böylece rakip formüle geliyoruz:

σnew=1N(xiμ)2.
Öğrenci, bu formülün bölündüğünden çok ortalamadan "ortalama" sapmaya benzediğini savunduN olarakσ .

Bu sorunun aptalca olmadığını düşündüm. Öğrenciye sd'nin ortalama kare sapma olan varyansın sqrt'ı olarak tanımlandığını söylemekten daha ileriye giden bir cevap vermek istiyorum . Başka bir deyişle, öğrenci neden doğru formülü kullanmalı ve fikrini takip etmemeli?

Bu soru daha eski bir konu ve burada verilen cevaplarla ilgilidir . Oradaki cevaplar üç yöne gidiyor:

  1. σ ortalamadan "tipik" sapma değil, yani ortalama karekök (RMS) sapmasıdır (yaniσnew ). Böylece farklı tanımlanır.
  2. Güzel matematiksel özelliklere sahiptir.
  3. Ayrıca, sqrt orijinal birimlerine "birimleri" geri getirecektir. Bununla birlikte, bunun yerine N ile bölen için de durum söz konusudur .σnewN

Nokta 1 ve 2'nin her ikisi de sd'yi RMS olarak destekleyen argümanlardır, ancak kullanımına karşı bir argüman görmüyorum σnew. Ortalama RMS mesafe kullanımının giriş seviyesi öğrencilerin ikna etmek için iyi argümanlar ne olurdu σ ortalama den?


2
Bence "Standart sapma neden ... olarak tanımlanıyor?" Sorusunu cevaplamak zor. Tanımlar sadece keyfi etiketleme kurallarıdır. Bunlar uygun gerekmez neden 's.
ttnphns

"Why is the standard deviation defined as sqrt of variance and not as average of [the root of] sum of squares?"Sorunun içinde parantez içindeki şey bir şekilde kaybolmuş olabilir mi?
ttnphns

1
Ancak sd bir dizi amaca hizmet eder; bu şekilde tanımlandığından daha iyi bir motivasyon olmalı. Bu özellikle lisans öğrencilerinin öğretiminde yararlı olacaktır. Chebyshev'in eşitsizliği anlamında bir motivasyon hayal edebiliyorum (+/- sabit bir sd faktörü alanında vakaların min. Oranı).
tomka

2
Q'nuz beklemede olduğu için cevap veremiyoruz, ancak şunu deneyin: 1 ve 3 değerlerini kabaca eşit oranlarda gözlemlediğinizi hayal edin (bozuk para atın, H=3 , T=1 ). Gözlemlerin ortalamadan "tipik uzaklığı" 1 gibi bir şey olmalıdır.formülü,n içinçok, çok büyükbu tipik uzaklık ölçüsüne ne olduğunu düşünün. Her durumda| xi- ˉ x | 1'e yakın olacak, bu yüzden karelerinin toplamın'yeyakın olacak. Pay,SSE/nn|xix¯|n yaniortalamadan tipik uzaklık değişmesedenarttıkçaformülünüz küçülür. nn
Glen_b

1
@whuber Başka bir güncelleme yaptım ve umduğum nokta şimdi daha net. Not Burada, istatistiklerin temelleri hakkında bir soru sormanın yanı sıra, burada tavsiye vermeyi istiyorum. Alternatif bir formül önermiyorum, ama hemen cevap vermediğim bir öğrenci tarafından iyi bir sorunun sınıf durumundan bir örnek verdim. Kabul ediyorsanız, lütfen şu anda bekletmeden bırakılmasını rica ediyorum.
tomka

Yanıtlar:


12

Yeni başlayanlara kolayca açıklanabilecek en az üç temel sorun vardır:

  1. "Yeni" SD, sonsuz popülasyonlar için bile tanımlanmamıştır. (Bu tür durumlarda her zaman sıfıra eşit olduğu söylenebilir, ancak bu daha yararlı olmaz.)

  2. Yeni SD, rastgele örnekleme altında bir ortalamanın nasıl davranması gerektiğini göstermez.

  3. Yeni SD rağmen can (örneklerin ve sonlu popülasyonlarda) bir ortalamalarından sapmaları değerlendirmek için tüm matematiksel titizlik ile kullanılabilir, yorumlanması gereksiz yere karmaşık.

1. Yeni SD'nin uygulanabilirliği sınırlıdır

Nokta (1), entegrasyonda bilgili olmayanlara bile eve getirilebilir, çünkü varyans açıkça aritmetik bir ortalama (kare sapmalar) olduğu için, "sonsuz" popülasyon modellerine faydalı bir uzantısı . aritmetik ortalama varlığının sezgisi hala geçerlidir. Bu nedenle, kare kökü - olağan SD - bu gibi durumlarda da mükemmel bir şekilde tanımlanmıştır ve bir varyansın (doğrusal olmayan bir ifadesi) rolünde de yararlıdır. Bununla birlikte, yeni SD bu ortalamayı keyfi olarak büyük √'ye böler. , sonlu popülasyonlar ve sonlu örneklerin ötesinde genellemesini problemli hale getirir: ne yapmalı1N gibi durumlarda N eşittir?1/N

2. Yeni SD ortalama değil

"Ortalama" ismine layık herhangi bir istatistik, popülasyondan rastgele bir örneklem büyüklüğü arttıkça popülasyon değerine yakınsadığı özelliğe sahip olmalıdır. Herhangi sabit çarpan örneği SD ve nüfus SD bilgisayar hem de geçerli olacak çünkü SD çoklu, bu özelliği olurdu. (Alecos Papadopoulos tarafından sunulan argümanla doğrudan çelişmese de, bu gözlem, argümanın sadece gerçek sorunlara teğet olduğunu göstermektedir.) Ancak, "yeni" SD, 1 / değerine eşittir.Alışılmış olanın N katı,örnek büyüklüğüNbüyüdükçeher koşulda0'ayakınlaşır. Bu nedenle,herhangi bir sabit numune boyutuNiçin, yeni SD (uygun şekilde yorumlanmış), ortalama etrafında mükemmel yeterli bir varyasyon ölçüsü olmasınarağmen, haklı olarakevrenselolarak kabul edilemez.1/N0NN tüm örnek boyutları için aynı yorumlama ile uygulanabilir önlem edilemez veya herhangi bir anlamda doğru bir şekilde "ortalama" olarak adlandırılır.

3. Yeni SD yorumlamak ve kullanmak için karmaşık

boyutunda numuneleri almayı düşünün . Bu durumlarda yeni SD 1 / N=4kez normal SD. Bu nedenle, 68-95-99 kuralının bir analogu gibi karşılaştırılabilir yorumlara sahiptir (verilerin yaklaşık% 68'iortalamanınikiyeni SD'sinde,% 95'i ortalamanındörtyeni SD'sindevb. ve bu tür Chebychev en (en fazla irade beklemeye olarak klasik eşitsizliklerin versiyonları1/k2fazla veri uzanabilirsin2kyeni pazarcı uzakta onların ortalama den) ve Merkezi limit Teoremi benzer yeni SD açısından yeniden ifade edilebilir (biri √ ile bölünür1/N=1/21/k22kDeğişkeni standartlaştırmak için yeni SD'nin N katı). Bu nedenle, bu özel ve açıkça kısıtlanmış anlamda,öğrencinin önerisinde yanlış bir şey yoktur. Oldukça açık bir şekilde - - zorluk olsa da, bu açıklamaların hepsi içermesidir faktörleriniN. Bununla ilgili herhangi bir matematiksel problem olmamasına rağmen, istatistiklerin en temel yasalarının ifadelerini ve yorumlarını kesinlikle karmaşıklaştırmaktadır.N=2


Gauss ve diğerlerinin orijinal olarak Gauss dağılımını etkili kullanılarak2σNormal rastgele değişkenin yayılımını ölçmek için SD'nin 2 katı. Bu tarihsel kullanım, yerine SD'nindiğersabitkatlarınıkullanmanın uygunluğunu ve etkinliğini göstermektedir.2


Teşekkür ederim - bir soru geri (2. noktanıza ilişkin): büyürgibiN0,yakınsama11N0N belli ki? 1N
tomka

2
Biz numune SD kıyaslıyorsun Numunenin SD'sinin N katı ("yeni SD"). Olarak, Nbüyürse, numunenin SD (genellikle) sıfır olmayan yaklaşımlarsabitnüfus SD eşittir. Bu nedenle1/1/NNÖrnek SD'nin n katı sıfıra yakınsa. 1/N
whuber

Bu standart bir malzemedir - matematiksel istatistiklerde (adil olmak gerekirse, çoğu yeni başlayan için erişilebilir olmayacak) herhangi bir titiz ders kitabına danışın. Ancak cevabım için önemli sonuçlar daha zayıf ve sezgisel olarak açık bir ifadeden geliyor. sayısını düzeltin ve σ popülasyon SD'si olsun. Örnek SD'nin σ / A ve A σ arasında olma şansını göz önünde bulundurun . Numune boyutu N arttıkça bu şansın sıfıra gitmesi yeterlidir . Bu tek başına 1 / A>1σσ/AAσNÖrnek SD'nin N katıneredeyse kesinolarak0'ayakınlaşırve cevaptaki noktayı (2) gösterir. 1/N0
whuber

+1, artı ölçek değişmez vb. Değil (bu formun bir anı için gerekli bir koşul)
Nikos M.

@Nikos Teşekkür ederim, ama ölçek değişmez değil mi? Her ikisi de veGDveriler yeniden olçeklendirilmiş zaman değişir. SD/NSD
whuber

5

Assume that your sample contains only two realizations. I guess an intuitive measure of dispersion would be the average absolute deviation (AAD)

AAD=12(|x1x¯|+|x2x¯|)=...=|x1x2|2

So we would want other measures of dispersion at the same level of units of measurement to be "close" to the above.

The sample variance is defined as

σ2=12[(x1x¯)2+(x2x¯)2]=12[(x1x22)2+(x2x12)2]

=12[(x1x2)24+(x1x2)24]=12(x1x2)22

=12|x1x2|22

To return to the original units of measurement, if we did as the student wondered/suggested,we would obtain the measure, call it q

q12|x1x2|22=12|x1x2|2=12AAD<AAD

i.e. we would have "downplayed" the "intuitive" measure of dispersion, while if we have considered the standard deviation as defined,

SDσ2=|x1x2|2=AAD

Since we want to "stay as close as possible" to the intuitive measure, we should use SD.

ADDENDUM
Let's consider now a sample of size n We have

nAAD=i=1n|xix¯|

and

nVar(X)=i=1n(xix¯)2=i=1n|xix¯|2

we can write the right-hand side of the variance expression as

i=1n|xix¯|2=(i=1n|xix¯|)2ji|xix¯||xjx¯|

=(nAAD)2ji|xix¯||xjx¯|

Then the dispersion measure qn will be

qn1n[n2AAD2ji|xix¯||xjx¯|]1/2

=[AAD21n2ji|xix¯||xjx¯|]1/2

Now think informally: note that ji|xix¯||xjx¯| contains n2n terms, and so divided by n2 will left us with "one term in the second power". But also "one term in the 2nd power" is what we have in AAD2: this is a primitive way to "sense" why qn will tend to zero as n grows large. On the other hand the Standard Deviation as defined would be

SD1n[n2AAD2ji|xix¯||xjx¯|]1/2

=[nAAD21nji|xix¯||xjx¯|]1/2

Continuing are informal thinking, the first term gives us n "terms in the 2nd power", while the second term gives us n1 "terms in the second power" . So we will be left eventually with one such term, as n grows large, and then we will take its square root.
This does not mean that the Standard Deviation as defined will equal the Average Absolute Deviation in general (it doesn't), but it does show that it is suitably defined so as to be "on a par" with it for any n, as well as for the case when n.


1
Although this answer is interesting, I believe there are more important, convincing, and rigorous explanations (of which I have offered only a few in my own answer: much more could be said, especially concerning the role of the SD in the Central Limit theorem and algebraic rules for computing SDs of sums of independent random variables).
whuber

2
@whuber Certainly. I just opted for a "the bell has rung" approach to destroy the student's intermission!
Alecos Papadopoulos
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.