Yüksek kaldıraçlı oldukça önemli sayıda aykırı değer içeren 7 boyutlu bir bulut bulutuna genelleştirilmiş bir Gauss dağılımı yerleştirmem gerekiyor. Bu iş için iyi bir R paketi biliyor musunuz?
Yüksek kaldıraçlı oldukça önemli sayıda aykırı değer içeren 7 boyutlu bir bulut bulutuna genelleştirilmiş bir Gauss dağılımı yerleştirmem gerekiyor. Bu iş için iyi bir R paketi biliyor musunuz?
Yanıtlar:
Ayrıca bir de mclust var: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html
Dikkat edilmesi gereken bir nokta vardır: yüksek boyutlu alandaki karışım modellemesi, puan bulutunuz büyükse oldukça CPU ve bellek yoğun olabilir. Yaklaşık dört yıl önce 11 boyutlu, 50-200K nokta veri toplu işini yapıyordum ve 4-11GB RAM'e girme ve her vaka için hesaplanması bir hafta kadar sürüyordu (ve 400'üm vardı). Bu kesinlikle mümkündür, ancak paylaşılan bir hesaplama kümesi kullanıyorsanız veya sınırlı kaynaklarınız varsa baş ağrısı olabilir.
Bu klasik bir çok değişkenli Gauss Karışım Modeli gibi geliyor. BayesM paketinin işe yarayabileceğini düşünüyorum.
İşte bazı çok değişkenli Gauss Karışımı paketleri