PCA ve LDA yöntemleri ile uğraşıyordum ve bir noktada takılı kaldım, göremediğim kadar basit bir his var.
İçinde sınıfının ( ) arasında sınıfının ( S B ) dağılım matrisleri gibi tanımlanır:
Toplam saçılma matrisi şu şekilde verilir:
burada C sınıf sayısı ve N örnek sayısı numuneler, μ i sınıf ortalaması, μ genel ortalamadır.
Türetmek için çalışırken Gördüğüm bir noktaya kadar geldi:
bir terim olarak. Bunun sıfır olması gerekiyor, ama neden?
Aslında:
2
Cevap, değerlerin ortalamaları arasındaki sapmaları topladığınız ve bu toplamın sıfır olduğu. Ama tam olarak, , m ve m i nedir? M ve m i μ ve μ i ile nasıl ilişkilidir ? Cevapların kalitesi ne kadar doğru tahmin ettiğimize bağlı olacaktır, ancak bizi çok fazla tahmin yapmaya zorluyorsunuz!
—
whuber
@whuber: Tamamen haklısın, sorumu revize ettim.
—
nimcap