Standart Sapmayı artıran değer


12

Aşağıdaki ifadeden şaşkınım:

"Bir sayı kümesinin standart sapmasını artırmak için, ortalamadan uzağa birden fazla standart sapma olan bir değer eklemelisiniz"

Bunun kanıtı nedir ? Tabii ki standart sapmayı nasıl tanımladığımızı biliyorum ama bu kısmı bir şekilde özlüyorum. Herhangi bir yorum?


1
İlgili cebiri bulmaya çalıştınız mı?
Alecos Papadopoulos

Evet bende var. N değerlerinin örnek varyansını n + 1 değerlerinin varyansından çıkardım ve farkın sıfırdan büyük olmasını istedim. Yine de tam olarak anlayamıyorum.
JohnK

3
En basit yöntemlerden biri ayırt etmek için olan Welford algoritması yeni bir değer ile ilgili olarak xn ve göstermek için entegre olduğunu sokulması halinde xn sonra varyans artar (xn-x¯n-1)2nn-1vn-1buradax¯n-1ilkn-1değerlerinin ortalaması vevn-1bunların varyans tahminidir.
whuber

Tamam ama bu basit bir cebirle gösterilebilir mi? İstatistik bilgim o kadar ileri değil.
JohnK

@JohnK, teklifin kaynağını paylaşabilir misiniz?
Pe Dro

Yanıtlar:


20

İçin herhangi bir numaraları y 1 , y 2 , ... , Y , N , ortalama ile ˉ y = 1N-y1,y2,...,yN-, varyans σ 2 tarafından verilir y¯=1N-Σben=1N-yben uygulama(1)verilen diziNnumaralarıx1,x2,..., x, n , biz maruz kolaylık sağlamak için aldığı ortalama olmasıˉx=0, σ2=1 var

σ2=1N--1Σben=1N-(yben-y¯)2=1N--1Σben=1N-(yben2-2ybeny¯+y¯2)=1N--1[(Σben=1N-yben2)-2N-(y¯)2+N-(y¯)2](1)σ2=1N--1Σben=1N-(yben2-(y¯)2)
(1)nx1,x2,...xnx¯=0 Şimdibu veri kümesineyeni bir gözlemxn+1eklersek,veri kümesinin yeni ortalaması 1 olur.
σ2=1n-1Σben=1n(xben2-(x¯)2)=1n-1Σben=1nxben2
xn+1 yeni varyans ise σ 2
1n+1Σben=1n+1xben=nx¯+xn+1n+1=xn+1n+1
Yani| xn+1| σ√ 'den daha büyük olması gerekir
σ^2=1nΣben=1n+1(xben2-xn+12(n+1)2)=1n[((n-1)σ2+xn+12)-xn+12n+1]=1n[(n-1)σ2+nn+1xn+12]>σ2 Yalnızca xn+12>n+1nσ2.
|xn+1| ya da, daha genel olarak,X, n+1ihtiyaçları ortalama farklı olmasınaˉXdaha özgün veri kümesinin ileσσ1+1nxn+1x¯ , arttırılmış veri kümesinin orijinal veri kümesinden daha büyük varyansa sahip olması için. Ayrıca bkz. Ray Koopman'ın yeni varyansınxn+1'egöre orijinal varyanstan daha büyük, ona eşit veya ondan daha küçük olduğunu gösteren cevabı ortalamadanσdeğerinden daha fazla, tam olarak veya daha düşüktür.σ1+1nxn+1 .σ1+1n

5
1 Nihayet birileri ... doğru alır ;-) deyimi ispat edilmesi olduğunu doğru; sadece sıkı değil. Bu arada, yapmak için ölçüm birimlerinizi de seçebilirsiniz , bu da hesaplamayı daha da basitleştirerek yaklaşık iki satıra indirir. σ2=1
whuber

İlk denklem setinde sigma yerine S kullanmanızı ve türev için teşekkürler. Bilmek güzeldi :)
Theoden

3

Şaşırtıcı ifade, standart sapmanın artması için gerekli ancak yetersiz bir koşul sağlar. Eski örnek boyutu ise , eski ortalamasıdır m eski standart sapma, s , ve yeni bir nokta x , daha sonra yeni standart sapma eşit veya daha büyük, daha az olacak verilere eklenir s göre olarak | x - m | s'den küçük, eşit veya daha büyük nmsxs|x-m| .s1+1/n


1
Elinizde bir kanıt var mı?
JohnK

2

Cebiri bir kenara bırakmak (aynı zamanda işe yarar) bunu şu şekilde düşünün: Standart sapma varyansın kare köküdür. Varyans, ortalamadan kare uzaklıkların ortalamasıdır. Ortalamaya bundan daha yakın bir değer eklersek, varyans küçülür. Ortalamadan bundan daha uzak bir değer eklersek, büyür.

Bu, negatif olmayan değerlerin ortalama değerleri için geçerlidir. Ortalamadan daha yüksek bir değer eklerseniz, ortalama artar. Daha az bir değer eklerseniz, azalır.


Ben de titiz bir kanıt görmek isterim. İlkeyi anlasam da, değerin ortalamadan en az 1 sapma olması gerektiği gerçeğine şaşırıyorum. Neden tam olarak 1?
JohnK

Neyin kafa karıştırıcı olduğunu görmüyorum. Varyans ortalamadır. Ortalamadan daha büyük bir şey eklerseniz (yani 1 saniyeden fazla) eklenir. Ama resmi deliller için bir değilim
Peter Flom - Monica'yı eski durumuna getirin

0.2 standart sapma ile ortalamanın üzerinde olabilir. O zaman neden artmasın ki?
JohnK

Hayır, verilerin ortalamasından daha büyük değil, kare mesafelerin ortalaması olan varyanstan daha büyük.
Peter Flom - Monica'yı eski durumuna döndürün

4
Kafa karıştırıcıdır çünkü yeni bir değer eklemek ortalamayı değiştirir, böylece tüm artıklar değişir. Yeni değer eski ortalamadan uzak olsa bile, SD'ye katkısının diğer değerlerin kalıntılarının karelerinin toplamının azaltılmasıyla telafi edilebileceği düşünülebilir. Bu, titiz kanıtların yararlı olmasının birçok nedeninden biridir: sadece kişinin bilgisinde güvenlik sağlamakla kalmaz, aynı zamanda içgörü (ve hatta yeni bilgiler) de sağlarlar. Örneğin, kanıt SD'yi artırmak için ortalamadan bir SD'den kesinlikle daha yeni bir değer eklemeniz gerektiğini gösterecektir .
whuber

2

Z=x-μσ.
xZx
σ=Σben=1N-Zben2N--1
σZN-

Karesi alındığında mutlak değeri 1'den küçük olan bir sayı da abs'de 1'den küçük olacaktır. değer. Yine de anlamadığım şey, Z_N bu kategoriye girse bile, σ'ya pozitif bir değer katıyoruz, bu yüzden artmamalı mı?
JohnK

ZN-+1

1
N-σΣZben2

Tam olarak anlatmaya çalıştığım şey!
wcampbell

ZbenN--1
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.