Ortalama artı bir standart sapma maksimum değeri aşabilir mi?


19

Minimum 0 ve maksimum 94.33 olan bir örnek için ortalama 74.10 ve standart sapma 33.44 var.

Profesörüm bana ne anlama gelebileceğini ve bir standart sapmanın maksimum değeri aştığını sorar.

Ona bununla ilgili birçok örnek gösterdim, ama anlamıyor. Ona göstermek için referansa ihtiyacım var. Bir istatistik kitabından, özellikle bununla ilgili herhangi bir bölüm veya paragraf olabilir.


Neden ortalamadan bir standart sapma eklemek (veya çıkarmak) istiyorsunuz? SD, verilerin yayılmasının bir ölçüsüdür. Bunun yerine ortalamanın standart hatasını istediniz mi?
Monica'yı eski

Toplamak veya çıkarmak istemiyorum, bunu isteyen profesörüm. Standart sapmayı böyle anlıyor
Boyun Omuru

5
İlginç bir örnek örnektir (0.01,0.02,0.98,0.99). Hem ortalama artı standart sapma hem de ortalama eksi standart sapma dışındadır [0,1].
Glen_b -18 Monica 14

Belki de sadece Normal bir dağılım düşünüyor?
user765195

Yanıtlar:


28

Kesinlikle ortalama artı bir sd en büyük gözlemi aşabilir.

Örnek 1, 5, 5, 5'i düşünün -

ortalama 4 ve standart sapma 2'ye sahiptir, bu nedenle ortalama + sd, maksimumdan bir daha fazla olan 6'dır. İşte R'deki hesaplama:

> x=c(1,5,5,5)
> mean(x)+sd(x)
[1] 6

Bu yaygın bir olay. Bir grup yüksek değer ve sola doğru bir kuyruk olduğunda (yani, güçlü bir sol çarpıklık ve maksimuma yakın bir tepe olduğunda) gerçekleşir.

-

Aynı olasılık sadece numuneler için değil, olasılık dağılımları için de geçerlidir - popülasyon ortalaması artı populasyon sd'si mümkün olan maksimum değeri kolayca aşabilir.

İşte bir beta örneği ( 10 , 1maksimum olası değeri 1 olan yoğunluk:beta(10,12)

resim açıklamasını buraya girin

Bu durumda, ortalamanın şu olduğunu belirten beta dağıtımı için Wikipedia sayfasına bakabiliriz:

E[X]=αα+β

ve varyans:

var[X]=αβ(α+β)2(α+β+1)

(Türetilmesi oldukça kolay olduğu için Wikipedia'ya güvenmemize rağmen.)

Yani ve β = 1 içinα=10 biz ortalama0.9523ve sd0.0628, yani ortalama + sd1.0152, olası maksimum 1'den fazla.β=120.95230.06281.0152

Yani, veri değeri olarak gözlenemeyen bir ortalama + sd değerine sahip olmak kolayca mümkündür .

-

Modun maksimum olduğu herhangi bir durum için Pearson modu çarpıklığının yalnızca Ortalama + sd için maksimum değeri aşan 1 . Olumlu ya da olumsuz herhangi bir değer alabilir, bu yüzden kolayca mümkün olduğunu görebiliriz.<1

-

Sıklıkla ilişkili bir konu, yaygın olarak kullanılan bir aralığın, normal yakınlaştırma aralığının dışında sınırlar üretebildiği bir binom oranı için güven aralıkları ile görülür [ 0 , 1 ][0,1] .

Örneğin, Bernoulli çalışmalarındaki başarıların popülasyon oranı için% 95.4 normal bir yaklaşım aralığı düşünün (sonuçlar, başarı ve başarısızlık olaylarını temsil eden sırasıyla 1 veya 0'dır), burada 4 gözlemden 3'ü " " ve bir gözlem " 0 " dır.10 " .

Daha sonra aralığı için üst p^+2×14p^(1p^)=p^+p^(1p^)=0.75+0.433=1.183

Bu sadece örnek ortalama + binom için sd'nin normal tahmini ... ve imkansız bir değer üretir.

0,1,1,1 için normal numune SD bunlar farklı 0.5 yerine 0.433 (çünkü standart sapma binom ML tahmini p ( 1 - p ) göre varyans bölünmesi karşılık gelir , np^(1p^)n yerine ) . Ancak hiçbir fark yaratmaz - her iki durumda da, ortalama + sd mümkün olan en büyük oranı aşar.n1

Bu gerçek - binom için normal bir tahmin aralığının "imkansız değerler" üretebileceği genellikle kitaplarda ve makalelerde belirtilmektedir. Bununla birlikte, binom verileriyle uğraşmıyorsunuz. Bununla birlikte, sorun - yani bir takım standart sapmaların olası bir değer olmadığı anlamına gelir - benzerdir.

-

Sizin durumunuzda, numunenizdeki olağandışı "0" değeri sd'yi ortalamayı aşağı çektiğinden daha büyük yapıyor, bu yüzden ortalama + sd yüksek.

resim açıklamasını buraya girin

-

(Bunun yerine soru şu olurdu - hangi mantıkla imkansız olurdu? - çünkü birisinin neden bir sorun olduğunu düşündüğünü bilmeden neye hitap ediyoruz?)

Mantıken mantıklı bir şekilde, nerede olduğunu gösteren bir örnek vererek bunun mümkün olduğunu gösterir. Bunu zaten yaptın. Aksi halde olması gereken bir nedenin yokluğunda ne yapacaksınız?

Bir örnek yeterli değilse, hangi kanıt kabul edilebilir?

Kitaptaki bir ifadeye işaret etmenin hiçbir anlamı yoktur, çünkü herhangi bir kitap yanlışlıkla bir ifade verebilir - onları her zaman görüyorum. Kişi, cebirsel bir kanıt (yukarıdaki beta örneğinden * örneğin oluşturulabilir) veya herkesin gerçekliğini kendisinin inceleyebileceği sayısal örnekle (zaten verdiğiniz) mümkün olduğunun doğrudan gösterilmesine güvenmelidir. .

* whuber, yorumlarda beta vakası için kesin koşullar sağlar.


5
0<β<1α>β(1+β)/(1β)(α,β)1

Daha fazla açıklayayım. Dişlerin düzeltilmesinde kullanılan özel cihazların doğruluk yüzdesini arıyorum. Ve bu cihaz 7 diş için doğruluk yüzdesini şu şekilde gerçekleştirmiştir:% 76,19,% 77,41,% 94,33,% 91,06,% 0,% 87,77,% 91,96. Profesör, ortalamaya bir standart sapma ekliyor ve sonucun% 100 bile maksimum değeri geçemeyeceğini belirtti çünkü% 100, appliancek'in gerçekleştirebileceği maksimum doğruluk yüzdesi.
Boyun Omuru

2
% 100'ün üzerinde bir oranın durumunuzda bir anlam ifade etmediği konusunda haklı. Sorun aslında ne zaman ortalamaya bir sd ekleyerek, bu bağlamda mantıklı gerektiği yersiz öncül değil . Zorluğun kökeninin bu olduğuna inanıyorum. Önermenin nereden geldiğini anlarsak, daha iyi bir çözüme yol açabilir. Basit gerçeğin bir kitapta bir yerde belirtilmesi mümkündür (bu önemsiz bir gözlemdir, ancak bu da mümkün değildir), ancak şüphesiz onu tatmin edecek bir şekilde konulacağından şüpheliyim çünkü öncül sorunun kaynağıdır.
Glen_b

1
Aslında - benim asıl meselem, bu merakın, bir örnek almaktan ziyade güçlü simetrik olmayan dağılımlar için standart sapmaların temsil ettiği şeyin bir sonucu olmasıdır. Ama genel olarak, cevabınızın mükemmel olduğunu düşünüyorum
Henry

2
@tomka Benzer bir pozisyonda birçok öğrenciye yardım etmeye çalıştım. Sonunda (muhtemelen şaşırtıcı) temel kuralını bir amirine öğrencilerinin aracısıyla öğretmenin imkansız olduğunu öğrendim.
Glen_b

4

Chebyshev eşitsizliği Başına daha az k -2 puan fazla olabilir k standart sapmalar uzakta. Yani, k = 1 için bu, numunelerinizin% 100'ünden daha azının, standart sapmadan daha fazla olabileceği anlamına gelir.

Düşük sınırlara bakmak daha ilginç. Profesörünüz, ortalamanın yaklaşık 2.5 standart sapması olan noktalar olduğundan daha fazla şaşırmalıdır. Ancak şimdi numunelerinizin yalnızca yaklaşık 1 / 6'sının 0 olabileceğini biliyoruz.


3

σσ


5
Bu güzel bir katkı. Yine de SD'nin gerçekten normal bir dağılımı "aldığından" emin değilim.
gung - Monica'yı eski

3
"Dağıtım uyumu" ve normale dönüşüm bulmak, farklı amaçlara sahip farklı prosedürlerdir.
whuber

2

X10<p<101-p

E(X)=p,SE(X)=p(1-p)

Ve istiyoruz

E(X)+SE(X)>1p+p(1-p)>1

p(1-p)>(1-p)

Elde etmek için her iki tarafı da kare

p(1p)>(1p)2p>1pp>12

In words, for any Bernoulli random variable with p>1/2 the theoretical expression E(X)+SE(X)>maxX holds.

So for example, for any i.i.d. sample drawn from a Bernoulli with, say, p=0.7, in most cases the sample mean plus the sample standard deviation will exceed the value 1, which will be the maximum value observed (bar the case of an all-zeros sample!).

For other distributions we always have the opposite direction in the inequality, e.g. for a Uniform U(a,b), it is always the case that E(U)+SE(U)<maxU=b.
Therefore, no general rule exists.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.