Bu eski bir sorudur ancak kabul edilen cevap aslında doğru veya tam değildir. Kullanıcı, ortalama ve standart sapmanın zaten her ay için hesaplanmış olduğu 12 aylık verilerin üzerindeki standart sapmayı hesaplamak istiyor. Her aydaki örnek sayısının aynı olduğunu varsayarak, her ayın verilerinden yıl boyunca örnek ortalamasını ve varyansını hesaplamak mümkündür. Basit olması için iki veri setine sahip olduğumuzu varsayalım:
X={x1,....xN}
Y={y1,....,yN}
Örnek ortalama ve örnek varyansının bilinen değerleri ile, , , , .μxμyσ2xσ2y
Şimdi aynı tahminleri hesaplamak istiyoruz.
Z={x1,....,xN,y1,...,yN} .
, şu şekilde hesaplandığını düşünün :μxσ2x
μx=∑Ni=1xiN
σ2x=∑Ni=1x2iN−μ2x
Toplam sete göre ortalama ve varyansı tahmin etmek için hesaplamamız gerekir:
μz=∑Ni=1xi+∑Ni=1yi2N=(μx+μy)/2
kabul edilen cevabında verilmiştir. Varyans için ancak hikaye farklı:
σ2z=∑Ni=1x2i+∑Ni=1y2i2N−μ2z
σ2z=12(∑Ni=1x2iN−μ2x+∑Ni=1y2iN−μ2y)+12(μ2x+μ2y)−(μx+μy2)2
σ2z=12(σ2x+σ2y)+(μx−μy2)2
Dolayısıyla, her bir alt kümedeki varyansa sahipseniz ve tüm kümedeki varyansı istiyorsanız, her birinin aynı ortalamaya sahip olması durumunda, her bir alt kümenin varyanslarını ortalayabilirsiniz. Aksi takdirde, her bir alt kümenin ortalamasının varyansını eklemeniz gerekir.
Diyelim ki yılın ilk yarısında günde tam 1000 MWh, ikinci yarıda ise günde 2000 MWh üretiyoruz. Daha sonra, birinci ve ikinci yarıda enerji üretiminin ortalaması ve varyansı ortalama için 1000 ve 2000'dir ve her iki yarı için de varyans 0'dır. Şimdi ilgilenebileceğimiz iki farklı şey var:
1- Tüm yıl boyunca enerji üretiminin varyansını hesaplamak istiyoruz : o zaman iki varyansın ortalamasını alarak sıfıra varıyoruz; bu, tüm yıl boyunca günlük enerji sabit olmadığı için doğru değil. Bu durumda, her bir alt kümedeki tüm araçların varyansını eklememiz gerekir. Matematiksel olarak bu durumda ilgilenilen rasgele değişken günlük enerji üretimidir. Alt kümeler üzerinde örnek istatistiklere sahibiz ve örnek istatistikleri daha uzun bir sürede hesaplamak istiyoruz.
2- Yıllık enerji üretiminin varyansını hesaplamak istiyoruz: Başka bir deyişle, enerji üretiminin bir yıldan diğer yıla ne kadar değiştiğiyle ilgileniyoruz. Bu durumda varyansın ortalaması, 0 olan doğru cevaba yol açar, çünkü her yıl ortalama olarak tam 1500 MHW üretiyoruz. Matematiksel olarak bu durumda ilgilenilen rasgele değişken, ortalama değerin tüm yıl boyunca yapıldığı günlük enerji üretimi ortalamasıdır.