«classification» etiketlenmiş sorular

İstatistiksel sınıflandırma, alt popülasyonunun kimliğinin bilinmediği yeni gözlemlerin ait olduğu alt popülasyonu, alt popülasyonu bilinen gözlemleri içeren veri içeren bir eğitim seti temelinde tanımlama sorunudur. Bu nedenle bu sınıflandırmalar istatistiklerle incelenebilen değişken bir davranış gösterecektir.

2
Sınırlı Boltzmann makineleri vs çok katmanlı sinir ağları
Karşılaştığım bir sınıflandırma problemi için sinir ağı ile deneyler yapmak istiyordum. RBM'lerden bahseden gazetelere rastladım. Ama anladığım kadarıyla, çok katmanlı bir sinir ağına sahip olmaktan farklı değiller. Bu doğru mu? Dahası, R ile çalışıyorum ve RBM'ler için hazır paketler göremiyorum. Temelde yığılmış RBM'leri olan ama bunları R'de uygulama çabasına değip …

3
Denetimli kümeleme veya sınıflandırma?
İkinci soru, web'de bir yerde, "denetimli kümeleme" hakkında konuştuğumda, kümelenmenin denetimsiz olduğunu bildiğim bir tartışmada buldum, peki "denetimli kümelenme" nin tam anlamı nedir? "Sınıflandırma" açısından fark nedir? Bunun hakkında konuşan birçok bağlantı var: http://www.cs.uh.edu/docs/cosc/technical-reports/2005/05_10.pdf http://books.nips.cc/papers/files/nips23/NIPS2010_0427.pdf http://engr.case.edu/ray_soumya/mlrg/supervised_clustering_finley_joachims_icml05.pdf http://www.public.asu.edu/~kvanlehn/Stringent/PDF/05CICL_UP_DB_PWJ_KVL.pdf http://www.machinelearning.org/proceedings/icml2007/papers/366.pdf http://www.cs.cornell.edu/~tomf/publications/supervised_kmeans-08.pdf http://jmlr.csail.mit.edu/papers/volume6/daume05a/daume05a.pdf vb ...

3
Dengesiz veriler için sınıflandırma / değerlendirme ölçütleri
Dolandırıcılık tespiti (kredi puanlama benzeri) sorunu ile ilgileniyorum. Dolayısıyla, hileli ve hileli olmayan gözlemler arasında oldukça dengesiz bir ilişki vardır. http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html , farklı sınıflandırma ölçümlerine harika bir genel bakış sağlar. Precision and Recallya da kappaher ikisi de iyi bir seçim gibi görünüyor: Bu tür sınıflandırıcıların sonuçlarını haklı göstermenin bir yolu, …

3
Kısmi bağımlılık parsellerinin y eksenini yorumlayabilme
Bu soru edildi göç o Çapraz doğrulanmış üzerinde yanıtlanabilir çünkü yığın taşması gelen. 5 yıl önce göç etti . Kısmi bağımlılık parselleri hakkındaki diğer konuları okudum ve bunların çoğu, onları nasıl doğru bir şekilde yorumlayabileceğinizi değil, onları farklı paketlerle nasıl çizdiğinizle ilgili. Adil miktarda kısmi bağımlılık grafiği okuyordum ve yaratıyorum. …

2
Dengesiz veriler için lojistik regresyona ağırlık ekleme
Dengesiz verilerle lojistik bir regresyon modellemek istiyorum (9: 1). glmR işlevindeki ağırlıklar seçeneğini denemek istedim , ancak ne yaptığından% 100 emin değilim. Çıktı değişkenimin olduğunu söyleyelim c(0,0,0,0,0,0,0,0,0,1). şimdi "1" e 10 kat daha fazla ağırlık vermek istiyorum. bu yüzden ağırlık tartışmasını yapıyorum weights=c(1,1,1,1,1,1,1,1,1,1,1,10). Bunu yaptığımda, maksimum olasılığın hesaplanmasında dikkate alınacaktır. …

3
Perceptron kuralından Gradient İnişe: Sigmoid aktivasyon işlevine sahip Perceptronların Logistic Regression'dan farkı nedir?
Temelde benim sorum çok katmanlı Algılayıcılarda, algılayıcıların bir sigmoid aktivasyon işlevi ile kullanıldığıdır. Böylece güncelleme kuralında olarak hesaplanır.y^y^\hat{y} y^= 11 + exp( - wTxben)y^=11+exp⁡(-wTxben)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)} Bu "sigmoid" Perceptron'un lojistik regresyondan farkı nedir? Tek katmanlı bir sigmoid algılayıcının, her ikisinin de kullanması anlamında bir lojistik regresyona eşdeğer olduğunu söyleyebilirim. güncelleme …


5
Rastgele Ormanlarda yanlış sınıflandırma maliyeti nasıl kontrol edilir?
RandomForest R paketindeki yanlış sınıflandırma maliyetini kontrol etmek mümkün müdür ? Kendi işimde yanlış negatifler (örneğin, bir insanın bir hastalığa sahip olabileceği gibi yanlış) eksik, yanlış pozitiflerden çok daha maliyetlidir. Rpart paketi , kullanıcının farklı sınıflandırma ağırlıklarına göre farklılıklar için bir kayıp matrisi belirleyerek yanlış sınıflandırma maliyetlerini kontrol etmesine izin …

4
Bu durumda en az kare çözüm neden kötü sonuçlar veriyor?
Piskopos tarafından "Örüntü tanıma ve makine öğrenmesi" nin 4. bölümünde sayfa 204'te En Az kare çözümünün neden kötü sonuç verdiğini anlamadığım bir görüntü var: Önceki paragraf, en küçük karelere sahip çözümlerin aşağıdaki resimde gördüğünüz gibi aykırılıklara karşı sağlam olmadıkları gerçeğiyle ilgiliydi, ancak diğer görüntüde neler olup bittiğini ve LS'nin neden …

5
Sınıflandırma sonuçlarının önemini test etmenin doğru yolu nedir
Birkaç farklı sınıflandırıcıyı eğitebileceğiniz veya birkaç farklı özellik çıkarma yöntemi kullanabileceğiniz birçok durum vardır. Literatürde yazarlar sıklıkla verinin bir rasgele bölmeleri kümesi (yani iki kat yuvalanmış çapraz doğrulama sonrasında) üzerinde ortalama sınıflandırma hatası verir ve bazen de bölmeler üzerindeki hata üzerinde değişiklikler yapar. Bununla birlikte, bu kendi başına bir sınıflandırıcının …

4
PCA alanına yeni bir vektör nasıl yansıtılır?
Temel bileşen analizi (PCA) yaptıktan sonra, PCA alanına yeni bir vektör yansıtmak istiyorum (yani PCA koordinat sistemindeki koordinatlarını bulmak). PCA'yı R dilinde kullanarak hesapladım prcomp. Şimdi vektörümü PCA dönme matrisi ile çarpabilmeliyim. Bu matristeki temel bileşenler satır veya sütunlar halinde mi düzenlenmelidir?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

1
Sınıflandırmada eğitim verilerinin üretilmesi için tabakalı ve rastgele örneklemenin faydaları
Orijinal veri kümesini sınıflandırma için eğitim ve test setine bölerken rastgele örnekleme yerine tabakalı örnekleme kullanmanın herhangi bir / bazı avantajları olup olmadığını bilmek istiyorum. Ayrıca, tabakalı örnekleme sınıflandırıcıya rastgele örneklemeden daha fazla yanlılık getirir mi? Veri hazırlama için tabakalı örnekleme kullanmak istediğim uygulama, orijinal veri kümesinin üzerinde eğitilmiş bir …

3
Sınıf Olasılıklarını Tahmin Etmek İçin Makine Öğrenmesi
Örneklerin iki sınıftan birine ait olma olasılıklarını ortaya çıkaran sınıflandırıcılar arıyorum. Lojistik regresyon ve saf Bayes'i biliyorum, ama bana benzer şekilde çalışan diğerlerinden bahseder misiniz? Yani, örneklerin ait olduğu sınıfları değil, örneklerin belirli bir sınıfa uyma olasılığını tahmin eden sınıflandırıcılar? Bu farklı sınıflandırıcıların (lojistik regresyon ve naif Bayes dahil) avantajları …

3
Doğrusal ayrılabilirlik testi
İki sınıflı bir veri kümesinin doğrusal ayrılabilirliğini yüksek boyutlarda test etmenin bir yolu var mı? Özellik vektörlerim 40 uzun. Her zaman lojistik regresyon deneylerini çalıştırabildiğimi ve iki sınıfın doğrusal olarak ayrılabilir olup olmadığını belirlemek için hitrate vs false alarm oranını belirleyebileceğimi biliyorum, ancak bunu yapmak için zaten standart bir prosedür …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.