Standart sapmanın arkasındaki sezgi


26

Standart sapma hakkında daha sezgisel bir anlayış kazanmaya çalışıyorum.

Anladığım kadarıyla, bir veri kümesindeki bir gözlem kümesinin, o veri kümesinin ortalamasından bir farkının ortalamasını temsil ediyor. Bununla birlikte, ortalamalar dışında gözlemlere daha fazla ağırlık verdiğinden, aslında farklılıkların ortalamalarına eşit DEĞİLDİR.

Diyelim ki aşağıdaki değerler topluluğuna sahibim -{1,3,5,7,9}

Ortalamasıdır .5

Mutlak değere göre yayılım ölçüsü alırsam alıyorum

i=15|xiμ|5=2.4

Standart sapma kullanarak yayılma ölçüsünü alırsam alıyorum

i=15(xiμ)25=2.83

Standart sapma kullanan sonuç, beklenenden, ortalamadan daha fazla değerlere verdiği ekstra ağırlıktan dolayı daha büyüktür.

Ancak, ortalama olan bir popülasyonla ve standart bir sapma ile uğraştığımı söyleseydim , popülasyonun ? Öyle görünüyor ki rakamı çok keyfi ... Nasıl yorumlamanız gerektiğini anlamıyorum. Does değerleri çok yaygın olan veya hepsi sıkıca ortalama etrafında kümelenmiş olduğu anlamına ...52.83{1,3,5,7,9}2.832.83

Ortalama olan bir popülasyonla ve standart olarak bir sapmayla karşı karşıya olduğunuzu , bu size popülasyon hakkında ne söyler?52.83


2
Bu soru, aynı olmakla birlikte (aynı değildir) istatistik.stackexchange.com/q/81986/3277 ve oraya bağlı bir soru ile ilgilidir .
ttnphns,

1
Size ortalamanın 'tipik' bir mesafesini gösterir (RMS mesafesi). Bunu 'büyük' ​​veya 'küçük' yapan şey sizin kriterlerinize bağlıdır . Mühendislik toleranslarını ölçmeye çalışıyorsanız, çok büyük olabilir. Diğer bağlamlarda aynı standart sapma oldukça küçük olarak kabul edilebilir.
Glen_b -Reinstate Monica

Yanıtlar:


13

Sezgim, standart sapmanın şudur: Verilerin yayılmasının bir ölçüsü.

Geniş ya da dar olmasının, verinin dağıtımı için temel varsayımımızın ne olduğuna bağlı olduğuna dair iyi bir noktaya sahipsiniz.

Uyarma: Verilerinizin dağılımı ortalamanın etrafında simetrik olduğunda ve Normal dağılımınkine nispeten yakın bir varyansa sahip olduğunda, bir yayılma ölçüsü en yararlıdır. (Bu yaklaşık Normal olduğu anlamına gelir.)

Verilerin yaklaşık olarak Normal olması durumunda standart sapmanın kanonik bir yorumu vardır:

  • Bölge: Örnek ortalama +/- 1 standart sapma, verilerin yaklaşık% 68'ini içerir
  • Bölge: Örnek ortalama +/- 2 standart sapma, verilerin yaklaşık% 95'ini içerir
  • Bölge: Örnek ortalama +/- 3 standart sapma, verilerin yaklaşık% 99'unu içerir

( Wiki'deki ilk grafiğe bakın )

Bu, eğer nüfus ortalamasının 5 olduğunu ve standart sapmanın 2,83 olduğunu ve dağılımın yaklaşık olarak Normal olduğunu varsaydığımızı söylersek, size çok fazla gözlem yaparsak (% 5) 0,4 = 5 - 2 * 2,3'ten küçük veya 9,6 = 5 + 2 * 2,3'ten büyük.

Standart sapmanın güven aralığımız üzerindeki etkisi nedir? (ne kadar yayılırsa belirsizlik artar)

Ayrıca, verilerin yaklaşık olarak normal olmadığı, ancak yine de simetrik olduğu genel durumda, bunun için bir miktar olduğunu biliyorsunuz :α

  • Bölge: Örnek ortalama +/- standart sapma, verinin kabaca% 95'ini içerirα

bir alt örnekten öğrenebilir veya olduğunu varsayabilir ve bu, kafanızda gelecekteki hangi gözlemlerin beklenebileceğini veya yeni gözlemlerden hangisinin dikkate alınabileceğini hesaplamak için genellikle iyi bir kural sağlar. aykırı. (Ancak akılda ihmal tutmak!)αα=2

Nasıl yorumlaman gerektiğini anlamıyorum. 2.83, değerlerin çok geniş yayıldığı veya ortalama olarak sıkıca kümelenmiş olduğu anlamına mı geliyor?

Sanırım "geniş ya da sıkı" diye soran her soru da şunu içermelidir: "neye göre?". Bir öneri, referans olarak iyi bilinen bir dağıtım kullanmak olabilir. Bağlama bağlı olarak şöyle düşünmek yararlı olabilir: "Normal / Poisson'tan daha mı geniş veya daha mı?".

EDIT: Yorumlardaki faydalı bir ipucuna dayanarak, standart sapma ile ilgili bir mesafe ölçüsü olarak bir yön daha.

Yine, standart sapma faydalı olan diğer bir sezgi numune veriler arasında bir mesafe ölçüsü olduğunu ve ortalama :sNx1,,xNx¯

sN=1Ni=1N(xix¯)2

Karşılaştırma olarak, istatistikteki en popüler hata ölçütlerinden biri olan ortalama kare hatası (MSE) şöyle tanımlanır:

MSE=1ni=1n(Yi^Yi)2

Yukarıdaki mesafeden neden fonksiyon çıkıyor? Neden kare mesafeler ve örneğin mutlak mesafeler değil? Ve neden karekök alıyoruz?

Kuadratik mesafe veya hataya sahip fonksiyonlar, onları hem ayırt edebilmemiz hem de kolayca minimize edebilmemiz avantajına sahiptir. Karekök söz konusu olduğunda, hatayı tekrar gözlemlenen verilerimizin ölçeğine dönüştürdüğü için yorumlanabilirliğe eklenir.


Veriler normal olduğunda, neden bir yayılma ölçüsünün en 'faydalı' olduğunu söylüyorsunuz? Bana öyle geliyor ki, herhangi bir veri kümesinin bir yayılımı var ve standart sapma yaymanın şeklini yakalayamasa bile yaymanın bir özeti.
Michael Lew

Tabii haklısın. Ancak standart sapmanın herhangi bir şekilde dağılımın şekline bağlı olduğunu iddia etmiyordum. Sadece şekli hakkında biraz bilginiz varsa (veya bu varsayımı yapmaya hazırsanız) işaret etmek genellikle çok daha faydalı bir bilgidir. Benzer şekilde, örnek ortalaması verilerinizin iyi bir tanımlayıcısıdır, eğer dağıtım hakkında bazı genel varsayımlar yapabilirseniz.
anlamı

Mutlak değer yerine kareyi kullanmamın en sevdiğim nedeni, bazı Gauss'ların olasılıklarının bir logaritmasıdır. Eğer hataların doğada Gauss olduğuna ve bitlerin bilgiyi ölçmenin iyi bir yolu olduğuna inanıyorsanız, kare hatası kullanmak mantıklı olacaktır.
qbolec

5

Ortalamanın kütle merkezine benzer olduğunu fark etmenize yardımcı olabilir . Varyans momentidir . Standart sapma, dönme yarıçapıdır .

Tarihsel bir perspektif için şuna bir göz atın:

George Airy (1875) Gözlem hatalarının cebirsel ve sayısal teorisi ve gözlemlerin birleşimi üzerine

Karl Pearson (1894) Evrimin Matematik Teorisine Katkıları.

Airy 1875'ten alınan bu komplo, kolayca birbirleriyle çevrilen çeşitli sapma önlemlerini göstermektedir (sayfa 17). Standart sapma "ortalama karenin hatası" olarak adlandırılır. Ayrıca, 20-21. Sayfalarda ele alınmıştır ve 48. sayfadaki kullanımını haklı çıkarmaktadır; bu, elle hesaplamanın en kolay olduğunu göstermektedir; çünkü negatif ve pozitif hataların ayrı ayrı hesaplanmasına gerek yoktur. Standart sapma terimi, yukarıda sayfa 75'te belirtilen makalede Pearson tarafından verilmiştir.

görüntü tanımını buraya girin

Bir kenara olarak: Standart sapmanın faydasının, "çok sayıda bağımsız hata nedeninden" kaynaklanan "normal eğri" olarak da bilinen "hata yasasının" uygulanabilirliğine bağlı olduğuna dikkat edin (Airy 1875 pg 7). Her bireyin bir grup ortalamasından sapmalarının bu yasaya uymasını beklemenin bir nedeni yoktur. Biyolojik sistemler için çoğu durumda log log normal dağılım normalden daha iyi varsayılır. Görmek:

Limpert ve arkadaşları (2001) Bilim Genelinde Log-normal Dağılımlar: Anahtarlar ve Püf Noktaları

Bireysel varyasyonları gürültü olarak ele almanın uygun olup olmadığı sorgulanabilir, çünkü veri üreten süreç bireysel değil grup düzeyinde hareket eder.


3

Standart sapma, aslında, ortalamadan daha uzak olanlara daha fazla ağırlık verir, çünkü kare mesafelerinin ortalamasının kareköküdür. Bunu kullanma nedenleri (önerdiğiniz ortalama mutlak sapma ya da sağlam istatistiklerde kullanılan medyan mutlak sapma yerine), kısmen hesaplamanın polinomlarla mutlak değerlere göre daha kolay bir zaman geçirmesinden kaynaklanmaktadır. Ancak, sık sık, aşırı değerleri vurgulamak istiyoruz.

Sezgisel anlam hakkındaki sorunuza gelince - zamanla gelişir. Birden fazla sayı kümesinin aynı ortalama ve sd'ye sahip olabileceği doğru; Bunun nedeni, ortalama ve sd'nin sadece iki bilgi parçası olması ve veri setinin 5 adet (1,3,5,7,9) veya daha fazla olması olabilir.

Ortalama 5.83 ve 2.83 sd'nin "geniş" veya "dar" olması, çalıştığınız alana bağlıdır.

Yalnızca 5 numaranız olduğunda, tüm listeye bakmak kolaydır; Çok sayıda numaranız olduğunda, yayılma hakkında daha sezgisel düşünme yolları, beş sayı özeti veya daha iyi bir yoğunluk grafiği gibi grafikleri içerir.


2

Standart sapma, popülasyonunuzun ortalamadan rasgele değişkenler arasındaki mesafesini ölçer.

Her bir olasılık olasılığına sahip olması için 5 numaranızın eşit olarak gerçekleşmiş olduğunu ve varsayalım. Bu, rasgele değişkeni ile gösterilir .X:[0,1]R

X(t)={10t<15315t<25525t<35735t<45945t1

Fonksiyonlara ve ölçü teorisine geçmemizin nedeni, iki olasılık alanının sıfır oluşma şansı olan olaylarla nasıl aynı olduğunu tartışmak için sistematik bir yol bulmamız gerektiğidir. Şimdi fonksiyonlara geçtikten sonra bir mesafe hissine ihtiyacımız var.

Fonksiyon için mesafe çok duyu vardır özellikle Normlar için ve mesafe fonksiyonlarını .

||Y||p=(01|Y(t)|pdt)1/p
Y:[0,1]R1p<dp(Y,Z)=||XZ||p

Biz alırsak : normunu biz Bahsettiğiniz o naif mutlak değer sapmaları olsun Biz alırsak normunu biz her zamanki standart sapma olsun p=1

d1(X,5)=||X5_||1=2.4.
p=2
d2(X,5)=||X5_||2=2.83.

Burada , sabit işlevini belirtir .5_t5

Standart sapmanın anlamını anlamak gerçekten uzaklık fonksiyonunun anlamak ve birçok anlamda neden fonksiyonlar arasındaki mesafenin en iyi ölçüsü olduğunu anlamaktır.d2


Bu açıklama “sezgisel” görünmeyen bazı yapıları içerir. Asıl olan, tanımlanan bir fonksiyonun , ayar ile ilgisi olmayan bir aralığın istenmeyen görünüşüdür . ( olarak tanımlamak doğaldır, burada cebir in güç kümesidir. .) Ayrıca, " " gibi ifadelerin yorumlanması biraz sorunlu çünkü " " bir sayıyı temsil ediyor - popülasyonun ortalaması - rastgele bir değişken değil. Sonunda, tüm bu makineler tanıtıldıktan sonra, soru yeniden düzenlenir, ancak gerçekte cevaplanmamıştır. [0,1]X:{1,3,5,7,9}RX(i)=i{1,3,5,7,9}||X5||15
whuber

Evet, listelediğiniz rastgele değişken ölçü teorisi ile rahat olanlar için standart. Sadece matematik geçmişi olan insanlar için işlevleri ve entegrasyonu anlamak için onu daraltmayı umuyordum. Ortalamayı bir işlev olarak yeniden yazacağım.
SomeEE

Ayrıca, düzeltilmiş bir soru olduğu için, neden fonksiyonlar arasındaki mesafenin en iyi ölçüsü olduğu hakkında yorum eklemeyi öneriyor musunuz? d2
Bazı EE

Soru, standart sapmayı anlamak için sezgiyi sorar. Bazı fonksiyon uzaylarında bunun normunun nasıl olduğunu açıkladınız . Her ne kadar bu başka bir matematiksel formalizasyon sağlasa da (ve standart sapmanın farkında olmayan bir matematikçi için yeterli sezgi olsa da), asıl posterin istediği şeyin dışında kalıyor gibi görünüyor. En iyi karşılanacak şey, “mesafe işlevi anlamını” açıklayan ve sadece bir miktar “en iyi” mesafe ölçüsü olduğu duyularında ayrıntıya bir takip paragrafıdır . L2d2
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.