Pandalar ve scikit öğrenmek kullanarak python kümeleme bir kmeans kodlamak istiyorum. İyi k'yi seçmek için, Tibshirani ve al 2001'den ( Pdf ) Gap İstatistiğini kodlamak istiyorum .
Scikit'ten inertia_ sonucunu kullanıp kullanamayacağımı ve tüm istatistik hesaplamasını yeniden kodlamak zorunda kalmadan boşluk istatistik formülünü uyarlayıp uyarlayamayacağımı bilmek istiyorum .
Scikit / kullanılan atalet formülünü bilen var mı? Üst düzey mesafe fonksiyonlarını kullanarak boşluk istatistiğini yeniden kodlamanın kolay bir yolunu biliyor mu?
python
.