«gaussian-mixture» etiketlenmiş sorular

Alt popülasyonların Gauss dağılımlarını takip ettiğini varsayan bir tür karma dağıtım veya model.


2
K-anlamına gelen kümeleme Gauss karışım modellemesinin bir biçimiyse, veriler normal olmadığında kullanılabilir mi?
Bishop'u GMM için EM algoritması ve GMM ile k-ortalamaları arasındaki ilişki üzerine okuyorum. Bu kitapta k-means'ın GMM'nin zor atanmış bir versiyonu olduğu söyleniyor. Merak ediyorum ki, kümelenmeye çalıştığım veriler Gauss değilse, k-Ortalamaları kullanamam (ya da en azından kullanmak uygun değil)? Örneğin, veriler her biri 0 veya 1 değerine sahip 8 …

2
EM algoritması manuel olarak uygulandı
Ben elle EM algoritmayı uygulamak ve ardından sonuçlarına karşılaştırmak istediğiniz normalmixEMbir mixtoolspakette. Tabii ki, her ikisi de aynı sonuçlara yol açarsa mutlu olurum. Ana referans, Sonlu Karışım Modelleri olan Geoffrey McLachlan (2000) . Genelde iki Gausslu karışım yoğunluğum var, log olabilirliği (McLachlan sayfa 48): logLc(Ψ)=∑i=1g∑j=1nzij{logπi+logfi(yi;θi)}.günlük⁡Lc(Ψ)=Σben=1gΣj=1nzbenj{günlük⁡πben+günlük⁡fben(yben;θben)}. \log L_c(\Psi) = \sum_{i=1}^g \sum_{j=1}^n …

2
Gauss karışımını optimize etmek neden doğrudan hesaplama açısından zor?
Gauss'luların bir karışımının günlük olasılığını düşünün: l(Sn;θ)=∑t=1nlogf(x(t)|θ)=∑t=1nlog{∑i=1kpif(x(t)|μ(i),σ2i)}l(Sn;θ)=∑t=1nlog⁡f(x(t)|θ)=∑t=1nlog⁡{∑i=1kpif(x(t)|μ(i),σi2)}l(S_n; \theta) = \sum^n_{t=1}\log f(x^{(t)}|\theta) = \sum^n_{t=1}\log\left\{\sum^k_{i=1}p_i f(x^{(t)}|\mu^{(i)}, \sigma^2_i)\right\} Bu denklemi doğrudan maksimize etmenin niçin hesaplama açısından zor olduğunu merak ediyordum? Neden zor olduğu açık ya da belki de neden zor olduğu hakkında daha titiz bir açıklama üzerinde net bir sezgi arıyordum. Bu problem …

1
Sıfır hipotezi altında değiştirilebilir örneklerin ardındaki sezgi nedir?
Permütasyon testleri (randomizasyon testi, yeniden randomizasyon testi veya kesin test olarak da adlandırılır) çok faydalıdır ve örneğin normal dağıtım varsayımı t-testkarşılanmadığında ve değerlerin parametrik olmayan test Mann-Whitney-U-test, daha fazla bilginin kaybolmasına neden olur. Bununla birlikte, bu tür bir test kullanılırken bir ve sadece bir varsayım göz ardı edilmemelidir, örneklerin sıfır …
16 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
Beklenti Maksimizasyonu karışım modelleri için neden önemlidir?
Karışım modellerinde (Gauss Karışımı, Gizli Markov Modeli, vb.) Beklenen Maksimizasyon yöntemini vurgulayan birçok literatür vardır. EM neden önemlidir? EM, optimizasyon yapmanın bir yoludur ve degrade tabanlı yöntem (gradyan terbiyeli veya newton / yarı-newton yöntemi) veya BURADA tartışılan diğer gradyansız yöntem olarak yaygın olarak kullanılmaz . Buna ek olarak, EM'nin hala …

2
Kümeleme için karışım modeli nasıl takılır
İki değişkenim var - X ve Y ve kümeyi maksimum (ve optimal) = 5 yapmalıyım. Değişkenlerin ideal grafiği aşağıdaki gibidir: Bunun 5 kümesini yapmak istiyorum. Bunun gibi bir şey: Bu yüzden bu 5 küme ile karışım modeli olduğunu düşünüyorum. Her kümenin merkez noktası ve çevresinde bir güven dairesi vardır. Kümeler …

5
Gauss karışım modelinde tekillik sorunları
Örüntü tanıma ve makine öğrenimi kitabının 9. bölümünde Gauss karışım modeli hakkında bu kısım vardır: Dürüst olmak gerekirse, bunun neden tekillik yaratacağını gerçekten anlamıyorum. Bunu bana açıklayan var mı? Üzgünüm ama ben sadece bir lisans ve makine öğreniminde bir acemi değilim, bu yüzden sorum biraz aptalca gelebilir, ama lütfen bana …

3
Gauss Karışımlarının kullanımını haklı çıkaran referanslar
Gauss karışım modelleri (GMM'ler) caziptir, çünkü hem analitik olarak hem de pratikte çalışmak kolaydır ve çok fazla karmaşıklık olmadan bazı egzotik dağılımları modelleyebilirler. Genel olarak net olmayan birkaç analitik özellik beklemeliyiz. Özellikle: Say , bileşenli tüm Gauss karışımlarının sınıfıdır . Herhangi sürekli dağıtım için reals, biz olarak garanti edilmektedir büyür, …

1
Gauss Karışım Modelleri için farklı kovaryans türleri
Burada Gauss Karışım Modellerini denerken , bu 4 tür kovaryans buldum. 'full' (each component has its own general covariance matrix), 'tied' (all components share the same general covariance matrix), 'diag' (each component has its own diagonal covariance matrix), 'spherical' (each component has its own single variance). Bunları türlerinin her biri …


1
Normal dağılımların birleşiminden miktarlar
Farklı yaşlardaki çocuklar için antropometrik boyutların (omuz açıklığı gibi) dağılımı hakkında bilgi sahibim. Her yaş ve boyut için, standart sapma var. (Ayrıca sekiz adet kuantum var, ama onlardan istediğimi alabileceğimi sanmıyorum.) Her boyut için, uzunluk dağılımının belirli miktarlarını tahmin etmek istiyorum. Boyutların her birinin normal olarak dağıtıldığını varsayarsam, bunu araçlarla …

1
Mclust model seçimi
R paketi mclustküme modeli seçimi için bir ölçüt olarak BIC kullanır. Anladığım kadarıyla, en düşük BIC'ye sahip bir model diğer modellere göre seçilmelidir (sadece BIC'yi önemsiyorsanız). Ancak, BIC değerlerinin tümü negatif olduğunda, Mclustişlev varsayılan olarak en yüksek BIC değerine sahip olan modeldir. Çeşitli denemelerden elde ettiğim genel anlayış, mclust"en iyi" …

1
R / mgcv: te () ve ti () tensör ürünleri neden farklı yüzeyler üretir?
mgcvİçin paket Rtensör ürün etkileşimleri uydurma için iki işlevi vardır: te()ve ti(). İkisi arasındaki temel işbölümünü anlıyorum (doğrusal olmayan bir etkileşime uymak ve bu etkileşimi ana etkilere ve etkileşime ayırmak). Anlamadığım şey neden te(x1, x2)ve ti(x1) + ti(x2) + ti(x1, x2)(biraz) farklı sonuçlar üretebilir. MWE (uyarlanmıştır ?ti): require(mgcv) test1 <- …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

3
Küme çözümlerini değerlendirmek için iki Gauss karışımı arasındaki mesafe
Farklı kümeleme yöntemlerini karşılaştırmak için hızlı bir simülasyon çalıştırıyorum ve şu anda küme çözümlerini değerlendirmeye çalışan bir engelle karşılaşıyorum. Çeşitli doğrulama metriklerini biliyorum (çoğu R'de cluster.stats () öğesinde bulundu ), ancak tahmin edilen küme sayısının gerçek kümelerin gerçek sayısına eşit olması durumunda bunların en iyi şekilde kullanıldığını varsayıyorum. Orijinal simülasyonda …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.