Tüm alt numuneler aynı numune boyutuna sahipse, formül oldukça basittir. boyutunda alt örnekleri varsa (toplam örnekleri için), birleştirilmiş örneğin varyansı , her bir alt örneğin ortalama ve varyansına bağlıdır :
burada , numune araçlarının varyansı anlamına gelir.k g k E j V j V a r ( X 1 , … , X g k ) = k - 1gkgkEjVj
Var(X1,…,Xgk)=k−1gk−1(∑j=1gVj+k(g−1)k−1Var(Ej)),
Var(Ej)
R'de bir gösteri:
> x <- rnorm(100)
> g <- gl(10,10)
> mns <- tapply(x, g, mean)
> vs <- tapply(x, g, var)
> 9/99*(sum(vs) + 10*var(mns))
[1] 1.033749
> var(x)
[1] 1.033749
Örnek boyutları eşit değilse, formül çok hoş değildir.
EDIT: eşit olmayan örnek boyutları için formül
Varsa alt örnekler, her bir toplam için elemanları değerleri, daha sonra
burada , tüm araçların ağırlıklı ortalamasıdır (ve tüm değerlerin ortalamasına eşittir) ).gkj,j=1,…,gn=∑kj
Var(X1,…,Xn)=1n−1(∑j=1g(kj−1)Vj+∑j=1gkj(X¯j−X¯)2),
X¯=(∑gj=1kjX¯j)/n
Yine bir gösteri:
> k <- rpois(10, lambda=10)
> n <- sum(k)
> g <- factor(rep(1:10, k))
> x <- rnorm(n)
> mns <- tapply(x, g, mean)
> vs <- tapply(x, g, var)
> 1/(n-1)*(sum((k-1)*vs) + sum(k*(mns-weighted.mean(mns,k))^2))
[1] 1.108966
> var(x)
[1] 1.108966
Bu arada, bu formüller ölçekli toplamı olarak arzu edilen varyans yazarak elde etmek kolaydır , daha sonra sokulması : , fark formülünün karesini kullanarak ve basitleştirme.ˉ X j [ ( X j i - ˉ X j ) - ( ˉ X j - ˉ X ) ] 2(Xji−X¯)2X¯j[(Xji−X¯j)−(X¯j−X¯)]2