En uygun küme numarasını belirlemenin herhangi bir yolu var mı yoksa en iyi değere karar vermek için sadece farklı değerleri denemeli ve hata oranlarını kontrol etmeli miyim?
R
) benzer bir Q yanıtladım : stackoverflow.com/a/15376462/1036500
En uygun küme numarasını belirlemenin herhangi bir yolu var mı yoksa en iyi değere karar vermek için sadece farklı değerleri denemeli ve hata oranlarını kontrol etmeli miyim?
R
) benzer bir Q yanıtladım : stackoverflow.com/a/15376462/1036500
Yanıtlar:
Kullandığım yöntem CCC (Kübik Kümeleme Kriterleri) kullanmaktır. Küme sayısını 1 arttırdığımda CCC'yi maksimuma çıkaracağım ve sonra CCC'nin ne zaman azalmaya başladığını gözlemliyorum. Bu noktada, kümelerin sayısını (yerel) maksimumda alırım. Bu, temel bileşenlerin sayısını seçmek için bir eğri çizgi çizimi kullanmaya benzer.
SAS Teknik Raporu A-108 Kübik Kümeleme Ölçütü ( pdf )
n k k p q X n × p M q × p Z z i k = 1 i k = gözlem sayısı = kümedeki sayı = değişken sayısı = küme sayısı = veri matrisi = küme matrisi = küme göstergesi anlamına gelir ( eğer küme , , aksi takdirde 0)
Her değişkenin ortalama 0 olduğunu varsayın: ,
M = ( Z ′ Z ) - 1 Z ′ X
T X ′ X S S B M ′ Z ′ Z M S S W T - B (toplam) matrisi = = (kümeler arasında) matrisi = = (kümeler içinde) matrisi = =
(trace = köşegen elemanların toplamı)
sütunlarını uzun bir sütuna yığınlayın.
Gerilemeye Kronecker'in ürün arasında ile özdeşlik matrisi
hesaplayın , bu gerileme yönünden - Aynı
CCC fikri karşılaştırmaktır Birlikte kümelerinin kümesi verilen almak sen noktaların düzgün yayılı seti kümeleme alacağı boyutlu uzayda.