Toplam (sınıf içinde + sınıf arasında) dağılım matrisinin türetilmesi


14

PCA ve LDA yöntemleri ile uğraşıyordum ve bir noktada takılı kaldım, göremediğim kadar basit bir his var.

İçinde sınıfının ( ) arasında sınıfının ( S B ) dağılım matrisleri gibi tanımlanır:SWSB

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

Toplam saçılma matrisi şu şekilde verilir:ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

burada C sınıf sayısı ve N örnek sayısı numuneler, μ i sınıf ortalaması, μ genel ortalamadır.xμiμ

Türetmek için çalışırken Gördüğüm bir noktaya kadar geldi:ST

(xμi)(μiμ)T+(μiμ)(xμi)T

bir terim olarak. Bunun sıfır olması gerekiyor, ama neden?


Aslında:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]

2
Cevap, değerlerin ortalamaları arasındaki sapmaları topladığınız ve bu toplamın sıfır olduğu. Ama tam olarak, , m ve m i nedir? M ve m i μ ve μ i ile nasıl ilişkilidir ? Cevapların kalitesi ne kadar doğru tahmin ettiğimize bağlı olacaktır, ancak bizi çok fazla tahmin yapmaya zorluyorsunuz! xmmimmiμμi
whuber

@whuber: Tamamen haklısın, sorumu revize ettim.
nimcap

Yanıtlar:


8

Varsayarsan

1Nt=1Nxti=μi

Sonra

i=1Ct=1N(xtiμi)(μiμ)T=i=1C(t=1N(xtiμi))(μiμ)T=0

ve formül tutar. İkinci terimle de aynı şekilde ilgileniyorsunuz.


2
(+1) İlk terimin devri olan ikinci terim de sıfır olmalıdır :-).
whuber

@whuber, evet, o da :)
mpiktas

Merhaba, varsayımın neden geçerli olduğunu anlamıyorum? Birisi bunu açıklayabilir mi?
MVT

1
μiμiiμi
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.