İki kovaryans matrisini birleştirme


11

Bir dağılımın kovaryansını paralel olarak hesaplıyorum ve dağıtılmış sonuçları tekil Gaussian'da birleştirmem gerekiyor. İkisini nasıl birleştiririm?

Benzer şekilde dağıtılmış ve boyutlandırılmışlarsa, ikisi arasında doğrusal olarak enterpolasyon.

Wikipedia kombinasyon için en altta bir forumla sağlıyor ancak doğru görünmüyor; aynı şekilde dağıtılmış iki dağılım aynı kovaryansa sahip olmalıdır, ancak sayfanın altındaki formül kovaryansı iki katına çıkarır.

İki matrisi birleştirmenin bir yolu var mı?


3
Wikipedia formülü sorunuzu cevaplıyor, Matt: bunun, daha sonra örnek boyutuna bölmeniz gereken kısmi bir formül olduğunu fark etmemiş olabilirsiniz.
whuber

1
Bunu şimdi anladım, sizin yardımınızla - eğer bir cevaba koyarsanız, cevap olarak işaretlerim.
Matt Kemp

Yanıtlar:


12

Bu soru çeşitli şekillerde çokça ortaya çıkıyor. Onlar için ortak olan şey

Verilerimin ayrık alt kümelerinden hesaplanan moment tabanlı istatistikleri nasıl birleştirebilirim?

En basit uygulama iki gruba ayrılan verilerle ilgilidir. Grup büyüklüklerini ve grup anlamını biliyorsunuz. Sadece bu dört nicelik açısından, verilerin genel anlamı nedir?

Diğer uygulamalar ortalamalardan varyanslara, standart sapmalara, kovaryans matrislerine, çarpıklıklara ve çok değişkenli istatistiklere genelleme yapar; ve birden fazla veri alt grubu içerebilir. Bu miktarların çoğunun biraz karmaşık an kombinasyonları olduğuna dikkat edin: örneğin standart sapma, birinci ve ikinci anların (ortalama ve ortalama kare) ikinci dereceden bir kombinasyonunun kare köküdür.

Bu gibi tüm durumlar, çeşitli anları toplamlara indirgeyerek kolayca halledilir , çünkü toplamlar açıkça ve kolayca birleştirilir: eklenir. Matematiksel olarak, şuna gelir: j 1 , j 2 , , j g boyutlarındaki ayrık gruplara ayrılmış bir grubunuz var: ( x 1 , xX=(x1,x2,,xn)j1,j2,,jg . İ. Grup X ( i ) = ( x j i + 1 , x j i + 2 , , x j i diyelim(x1,x2,,xj1;xj1+1,,xj1+j2;xj1+j2+1,;;,xn)i. Tanım olarak,y1,,yjherhangi bir verikümesininkincimomenti,k.Güçlerinortalamasıdır,X(i)=(xjben+1,xjben+2,...,xjben+1)ky1,...,yjk

μk(y)=(y1k+y2k++yjk)/j.

Açıkçası , k . Güçlerin toplamıdır . Bu nedenle, daha önceki verilerin ayrıştırılmasınajμk(y)k alt gruplarına, toplam n gücü toplamlar grubunaayırabilirvegn

nμk(X)=(x1k+x2k++xnk)=(x1k+x2k++xj1k)++(xj1++jg1+1k+xj1++jg1+2k++xnk)=j1μk(X(1))+j2μk(X(2))++jgμk(X(g)).

Tarafından bölme n sergileyen yönünden tüm yığının inci anı k alt gruplarının anları inci.kk

Mevcut başvuruda, kovaryans matrisindeki girdiler, elbette, çok değişkenli ikinci momentler ve ilk momentler olarak ifade edilebilir kovaryanslardır. Hesaplamanın kilit kısmı şudur: her adımda çok değişkenli verilerinizin iki belirli bileşenine odaklanmış olacaksınız; onlara ve y diyelim . Baktığınız sayılar formdaxy

((x1,y1),(x2,y2),...,(xn,yn)),

daha önce olduğu gibi gruplarına ayrıldı. Her grup için x i y i'nin ortalama ürün toplamını bilirsiniz : bu ( 1 , 1 ) çok değişkenli moment, μ ( 1 , 1 ) . Bu grup değerlerini birleştirmek için, bunları grup boyutlarıyla çarpacak, bu sonuçları toplayacak ve toplamı n'ye böleceksiniz .gxbenyben(1,1)μ(1,1)n

Bu yaklaşımı uygulamak için önceden düşünmeniz gerekir : yalnızca kovaryansları ve alt grup boyutlarını biliyorsanız kovaryansları birleştirmek mümkün değildir : ayrıca alt grupların araçlarını da bilmeniz gerekir (çünkü araçlar önemli bir şekilde dahil edilir tüm kovaryans formüllerinde) veya araçlara cebirsel olarak indirgenebilen bir şey. Formüllerde görünen sabitler konusunda da dikkatli olmanız gerekebilir; dikkatsizliğin ana tuzağı bir "örnek kovaryansını" ( n - 1'e bölünen ürünlerin toplamının-1nN (veya j i )yerine toplamı geri kazanmak için 1 (veya j i - 1 ile grup kovaryansını).n-1jben-1njben


Oh, evet: mevcut soru hakkında. Wikipedia makalesinde verilen formül, grup araçları (ilk anlar) ve ürünlerin grup toplamları olarak verilmiştir. Yukarıda açıkladığım gibi, bunlar bunları ekleyerek ve daha sonra kovaryansları elde etmek için sonuçları bir bölümle ayarlayarak birleştirilecektir . son bölümü gösterilmez.n


K-th anının tanımı hakkında biraz kafam karıştı. Sıfır ortalama veri mi alıyorsunuz?
reschu

@reschu Merkezi anları düşünüyorsunuz . Bu yazı doğru anlaşılacağı emin olmak için, ben neyi kastettiğini tanımlanan " anı." Tanım, ilk formülden hemen önce görünür. kinci
whuber

Kötü olabilir! 'Merkezi' ve 'ham' anları karıştırıyordum. Açıklama için teşekkürler!
reschu

Ben sondan önceki paragrafta "alt grup boyutlarının araçlarını bilmek" yerine "alt grupların araçlarını bilmek" okuması gerektiğini düşünüyorum? (Cevabı çok dikkatli çalışmak için uğraşmadığım için bunu kendim düzenlemekte tereddüt ediyorum)
Juho Kokkala

@Juho Çok haklısın. Bunu fark ettiğiniz için teşekkürler!
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.