En belirgin neden, değerlerde genellikle zaman dizisi olmamasıdır. Bu nedenle, verileri karıştırırsanız, verilerin aktardığı bilgilerde bir fark yaratmaz. Yönteminizi takip edersek, verileri her karıştırdığınızda farklı bir örnek sapması elde edersiniz.
Daha teorik cevap, örnek varyansının rastgele bir değişkenin gerçek varyansını tahmin etmesidir. Rastgele değişken doğru varyans olan
E [ ( X - E X ) 2 ] .X
E[(X−EX)2].
İşte E , beklentiyi veya "ortalama değeri" temsil eder. Dolayısıyla varyansın tanımı, değişkenin ortalama değerinden ortalama kare uzaklığıdır. Bu tanıma baktığınızda, veri olmadığı için burada "zaman sırası" yoktur. Bu sadece rastgele değişkenin bir özelliğidir.
Bu dağıtımdan iid verileri topladığınızda gerçekleşmelerine sahipsiniz . Beklentiyi tahmin etmenin en iyi yolu örnek ortalamaları almaktır. Buradaki anahtar, iid verisi elde etmemiz ve bu nedenle verilere herhangi bir sipariş verilmemesidir. Örnek X 1 , x 2 , ... , x , n örnek ile aynıdır x 2 , x 5 , x 1 , x , n . .x1,x2,…,xnx1,x2,…,xnx2,x5,x1,xn..
DÜZENLE
Numune varyansı, numune için ortalamadan ortalama mesafeyi ölçen spesifik bir dispersiyon türünü ölçer. Veri aralığı ve İnter-Quantile aralığı gibi başka dağılım türleri de vardır.
Değerlerinizi artan düzende sıralasanız bile, bu, örneğin özelliklerini değiştirmez. Aldığınız örnek (veriler), bir değişkenin gerçekleştirmeleridir. Örnek varyansının hesaplanması, değişkente ne kadar dispersiyon olduğunu anlamaya benzer. Örneğin, 20 kişiyi örnekleyip boylarını hesaplarsanız, bunlar rastgele değişken insanların yüksekliğinden 20 "gerçekleşme" olur . Şimdi örnek varyansının, genel olarak bireylerin yüksekliğindeki değişkenliği ölçmesi beklenmektedir. Verileri 100 , 110 , 123 , 124 , … sipariş ederseniz
,X=
100,110,123,124,…,
örnekteki bilgileri değiştirmez.
Bir örnek daha inceleyelim. Bu şekilde düzenlenmiş bir rastgele değişkenin 100 gözlemler sahip sağlar ki Ardından ortalama sonraki mesafe 1 birimdir, bu nedenle yönteminize göre varyans 1 olacaktır.
1,2,3,4,5,6,7,8,9,10,11,12,13,14,...100.
"Varyans" veya "dağılım" ı yorumlamanın yolu, veriler için hangi değer aralığının muhtemel olduğunu anlamaktır. Bu durumda, elbette varyasyonu iyi temsil etmeyen bir .99 birim aralığı alacaksınız.
Ortalama almak yerine sadece sonraki farkları toplarsanız, varyansınız 99 olacaktır. Tabii ki bu örneklemdeki değişkenliği temsil etmez, çünkü 99 size bir değişkenlik hissi değil, veri aralığını verir.