Sağlam çok değişkenli Gauss uyum R


11

Yüksek kaldıraçlı oldukça önemli sayıda aykırı değer içeren 7 boyutlu bir bulut bulutuna genelleştirilmiş bir Gauss dağılımı yerleştirmem gerekiyor. Bu iş için iyi bir R paketi biliyor musunuz?


3
Stats.stackexchange.com/questions/213/… adresinde benzer bir sorunun yanıtlarında çok değişkenli aykırı değerleri tanımlamak için en az dört R paketine bağlantılar bulacaksınız . Bu iyi bir başlangıç ​​olabilir.
whuber

Belki de soru beni kaçırıyor, ama çok değişkenli bir Gauss dağılımına uymakla birlikte, neden sadece ampirik ortalama ve SD'yi MLE olarak kullanmıyorsunuz? Daha sonra, yüksek etki / kaldıraç noktaları varsa teşhis istatistiklerine odaklanabilirsiniz.
AdamO

Soru, parametreleri tahmin etmek için Huberized loss fonksiyonu gibi bir şey kullanmakla ilgili olduğunu düşünüyorum. Ben bir uzman değilim, ama belki de Huber kaybını ortalamaya uyacak şekilde kullanmak bir başlangıç ​​olacaktır.
Tom Dietterich

Yanıtlar:


1

Ayrıca bir de mclust var: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html

Dikkat edilmesi gereken bir nokta vardır: yüksek boyutlu alandaki karışım modellemesi, puan bulutunuz büyükse oldukça CPU ve bellek yoğun olabilir. Yaklaşık dört yıl önce 11 boyutlu, 50-200K nokta veri toplu işini yapıyordum ve 4-11GB RAM'e girme ve her vaka için hesaplanması bir hafta kadar sürüyordu (ve 400'üm vardı). Bu kesinlikle mümkündür, ancak paylaşılan bir hesaplama kümesi kullanıyorsanız veya sınırlı kaynaklarınız varsa baş ağrısı olabilir.


1

Bu klasik bir çok değişkenli Gauss Karışım Modeli gibi geliyor. BayesM paketinin işe yarayabileceğini düşünüyorum.

İşte bazı çok değişkenli Gauss Karışımı paketleri

  • bayesm: cran.r-project.org/web/packages/bayesm/index.html
  • mixtools: www.jstatsoft.org/v32/i06/paper
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.