Gözlemler çoğaltıldığında neden bir numunenin varyansı değişir?


25

Varyansın bir yayılma ölçütü olduğu söylenir. Bu yüzden, varyansın, varyansa 3,5eşit olduğunu 3,3,5,5, sayılar eşit olarak yayıldığını düşündüm . Ama bu durum böyle değil, varyansı 3,5olduğu 2varyansı ise 3,3,5,5olduğunu 1 1/3.

Bu beni şaşırtıyor, varyansın yayılmanın bir ölçüsü olduğu söyleniyor.

Öyleyse, bu bağlamda yayılma ölçüsü ne anlama geliyor?

Yanıtlar:


32

Gibi varyans tanımlarsak sn2=MSE=1nΣben=1n(xben-x¯)2- Nüfus varyans benzeyen fakat örnek ortalamaμsonra hem numuneler aynı varyansa sahip olacaktır.

Bu yüzden fark tamamen Bessel'in örneklem varyansındaki normal formülde yaptığı düzeltme nedeniyledir ( sn-12=nn-1MSE=nn-11nΣben=1n(xben-x¯)2=1n-1Σben=1n(xben-x¯)2, gerçeği hangi ayarlanabilece¤indenörnekortalamaları yakın verilere nüfus ortalamasına göre ise bunun tarafsız (sağ değerini" alarak yapmak üzere olduğunu ortalama").

Etkisi, n - 1 gibi, artan örneklem büyüklüğüyle birlikte ortadan kalkarn-1n olarak 1'e gidern.

- İşte varyans için tarafsız tahmincisi kullanmak zorunda özel bir nedeni, bu arada sn2 mükemmel geçerli kestirimidir ve bazı durumlarda tartışmasız sapmasızlık büyük a mutlaka değil (daha yaygın formu göre daha avantajlı olabilir anlaştık mı).

Varyansın kendisi doğrudan bir yayılma ölçütü değildir. Veri setimdeki tüm değerleri ikiye katlarsam, bunların "spread" değerinin iki katı olduğunu iddia ediyorum. Ancak varyans 4 faktörü ile artar. Bu nedenle daha genel olarak, varyansın değil standart sapmanın bir yayılma ölçütü olduğu söylenir.

sn-1

Küçük örneklerde Bessel düzeltmesi, bu etki nedeniyle yayılma ölçüsü olarak standart sapmayı biraz daha az sezgisel hale getirir (örneğin kopyalanması değeri değiştirir). Ancak, birçok yayılma ölçüsü örneği kopyalarken aynı değeri korur; Birkaç söz edeceğim -

  • sn

  • ortalamadan ortalama (mutlak) sapma

  • ortancadan ortanca (mutlak) sapma

  • çeyrekler arası aralık (en azından bazı örnek quartil tanımları için)


3
“Tarafsız tahminciyi kullanmak zorunda olmanızın belirli bir nedeni yok” - gerçekten de hiçbir şeyi tahmin etmemelisiniz . İlk varyansa göre {3, 5}kendisinin varyansı 1'dir. Sizin de belirttiğiniz gibi, sorgulayıcı, bunun örnek teşkil ettiği varsayılan bir popülasyonun varyansını tahmin etmeye çalışmıştır, ancak bunun olup olmadığını bilir.
Steve Jessop

1

Bir çeşit anımsatıcı olarak, VX=EVX+VEX. Dolayısıyla, bir numunenin varyansının beklenen değeri çok düşüktür, fark ise numunenin ortalamasının varyansıdır.

Her zamanki örnek varyans formülü bunu telafi eder ve örneğin ortalama ölçeklerinin varyansı tersine örneklem büyüklüğü ile dengelenir.

Ekstrem bir örnek olarak, tek bir numune almak her zaman 0 örneklem varyansı gösterecektir, açıkçası altta yatan dağılım için 0 farklılığı göstermeyecektir.

Şimdi 2 ve 4 eşit ağırlıklı numuneler için düzeltici faktörler 2/1 ve 4/3, sırasıyla. Yani hesaplanan beklenen varyans bir faktöre göre değişir2/3. Numunenin kendisinin varyansı1Her iki durumda da. Ancak ilk dava, daha zayıf bir dava sunar.4 baz dağılımın ortalaması olmak ve diğer tüm değerler daha büyük bir farklılık anlamına gelir.


2
Conflating By tahmin edicileri ile istatistik , bu yanıt karıştırır yerine açıklığa kavuşturur soru. Lütfen Glen_b'in bu konudaki orijinal cevabını okuyun. İlk iki paragraftaki argüman gizemlidir çünkü soru ile alakasız görünüyor.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.