Bu soru çeşitli şekillerde çokça ortaya çıkıyor. Onlar için ortak olan şey
Verilerimin ayrık alt kümelerinden hesaplanan moment tabanlı istatistikleri nasıl birleştirebilirim?
En basit uygulama iki gruba ayrılan verilerle ilgilidir. Grup büyüklüklerini ve grup anlamını biliyorsunuz. Sadece bu dört nicelik açısından, verilerin genel anlamı nedir?
Diğer uygulamalar ortalamalardan varyanslara, standart sapmalara, kovaryans matrislerine, çarpıklıklara ve çok değişkenli istatistiklere genelleme yapar; ve birden fazla veri alt grubu içerebilir. Bu miktarların çoğunun biraz karmaşık an kombinasyonları olduğuna dikkat edin: örneğin standart sapma, birinci ve ikinci anların (ortalama ve ortalama kare) ikinci dereceden bir kombinasyonunun kare köküdür.
Bu gibi tüm durumlar, çeşitli anları toplamlara indirgeyerek kolayca halledilir , çünkü toplamlar açıkça ve kolayca birleştirilir: eklenir. Matematiksel olarak, şuna gelir: j 1 , j 2 , … , j g boyutlarındaki ayrık gruplara ayrılmış bir grubunuz var: ( x 1 , xX=(x1,x2,…,xn)j1,j2,…,jg . İ. Grup X ( i ) = ( x j i + 1 , x j i + 2 , … , x j i diyelim(x1,x2,…,xj1;xj1+1,…,xj1+j2;xj1+j2+1,…;…;…,xn)i. Tanım olarak,y1,…,yjherhangi bir verikümesininkincimomenti,k.Güçlerinortalamasıdır,X(i)=(xji+1,xji+2,…,xjben+1)ky1, … , Yjk
μk(y)=(yk1+yk2+⋯+ykj)/j.
Açıkçası , k . Güçlerin toplamıdır . Bu nedenle, daha önceki verilerin ayrıştırılmasınajμk(y)k alt gruplarına, toplam n gücü toplamlar grubunaayırabilirvegn
nμk(X)=(xk1+xk2+⋯+xkn)=(xk1+xk2+⋯+xkj1)+⋯+(xkj1+⋯+jg−1+1+xkj1+⋯+jg−1+2+⋯+xkn)=j1μk(X(1))+j2μk(X(2))+⋯+jgμk(X(g)).
Tarafından bölme n sergileyen yönünden tüm yığının inci anı k alt gruplarının anları inci.kk
Mevcut başvuruda, kovaryans matrisindeki girdiler, elbette, çok değişkenli ikinci momentler ve ilk momentler olarak ifade edilebilir kovaryanslardır. Hesaplamanın kilit kısmı şudur: her adımda çok değişkenli verilerinizin iki belirli bileşenine odaklanmış olacaksınız; onlara ve y diyelim . Baktığınız sayılar formdaxy
((x1, y1) , ( x2, y2) , … , ( Xn, yn) ) ,
daha önce olduğu gibi gruplarına ayrıldı. Her grup için x i y i'nin ortalama ürün toplamını bilirsiniz : bu ( 1 , 1 ) çok değişkenli moment, μ ( 1 , 1 ) . Bu grup değerlerini birleştirmek için, bunları grup boyutlarıyla çarpacak, bu sonuçları toplayacak ve toplamı n'ye böleceksiniz .gxbenyben( 1 , 1 )μ( 1 , 1 )n
Bu yaklaşımı uygulamak için önceden düşünmeniz gerekir : yalnızca kovaryansları ve alt grup boyutlarını biliyorsanız kovaryansları birleştirmek mümkün değildir : ayrıca alt grupların araçlarını da bilmeniz gerekir (çünkü araçlar önemli bir şekilde dahil edilir tüm kovaryans formüllerinde) veya araçlara cebirsel olarak indirgenebilen bir şey. Formüllerde görünen sabitler konusunda da dikkatli olmanız gerekebilir; dikkatsizliğin ana tuzağı bir "örnek kovaryansını" ( n - 1'e bölünen ürünlerin toplamının - 1nN (veya j i )yerine toplamı geri kazanmak için 1 (veya j i - 1 ile grup kovaryansını).n - 1jben- 1njben
Oh, evet: mevcut soru hakkında. Wikipedia makalesinde verilen formül, grup araçları (ilk anlar) ve ürünlerin grup toplamları olarak verilmiştir. Yukarıda açıkladığım gibi, bunlar bunları ekleyerek ve daha sonra kovaryansları elde etmek için sonuçları bir bölümle ayarlayarak birleştirilecektir . son bölümü gösterilmez.n