«unbalanced-classes» etiketlenmiş sorular

Her bir sınıfa ait gözlem sayısı ( ) sınıflar arasında sabit değilse, ayrı kategoriler veya * sınıflar * şeklinde düzenlenmiş veriler belirli analizler için sorun yaratabilir . Eşit olmayan sınıfları * dengesizdir *. nn

2
F-ölçü doğrulukla eşanlamlı mı?
F-tedbirinin (hassasiyet ve hatırlamaya dayalı olarak) bir sınıflandırıcının ne kadar doğru olduğunun bir tahmini olduğunu anlıyorum. Ayrıca, dengesiz bir veri setimiz olduğunda , f-ölçüsü doğruluktan daha fazla tercih edilir . Basit bir sorum var (teknolojiden çok doğru terminolojiyi kullanmakla ilgili). Dengesiz bir veri kümem var ve deneylerimde f-ölçü kullanıyorum. Bir …

1
Dengesiz veri kümeleri için ROC eğrileri
Bir giriş matrisi ve bir ikili çıkış düşünün .XXXyyy Bir sınıflandırıcının performansını ölçmenin yaygın bir yolu, ROC eğrilerini kullanmaktır. Bir ROC grafiğinde diyagonal, rastgele bir sınıflandırıcıdan elde edilecek sonuçtur. Dengesiz bir çıktı olması durumunda, rasgele bir sınıflandırıcının performansı, farklı olasılıklarla veya seçilerek geliştirilebilir .yyy000111 Böyle bir sınıflandırıcının performansı bir ROC …

1
SMOTE çok sınıflı dengesizlik problemi için hata veriyor
SMOTE'u çok sınıflı sınıflandırma sorunumdaki dengesizliği düzeltmek için kullanmaya çalışıyorum. SMOTE, SMOTE yardım belgesine göre iris veri kümesinde mükemmel çalışmasına rağmen, benzer bir veri kümesinde çalışmaz. Verilerim şöyle görünüyor. 1, 2, 3 değerlerine sahip üç sınıfı olduğunu unutmayın. > data looking risk every status 1 0 1 0 1 2 …

1
Hangi derin öğrenme modeli, birbirini dışlamayan kategorileri sınıflandırabilir
Örnekler: İş tanımında bir cümle var: "İngiltere'de Java kıdemli mühendisi". Derin bir öğrenme modelini 2 kategori olarak tahmin etmek istiyorum: English ve IT jobs. Geleneksel sınıflandırma modeli kullanırsam, sadece softmaxson katmanda işlevli 1 etiket tahmin edebilir . Bu nedenle, her iki kategoride "Evet" / "Hayır" ı tahmin etmek için 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
Kategorik değişkenlerle aşırı örnekleme
Veri setimi kabaca 4000 müşteriyle, gruplardan birinin yaklaşık% 15 oranında olduğu iki gruba ayırmak için aşırı örnekleme ve yetersiz örnekleme kombinasyonu yapmak istiyorum. SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) ve ROSE ( http://cran.r-project.org/web/packages/ROSE/ ROSE.pdf ), ancak bunların her ikisi de mevcut gözlemleri ve örneğin kNN'yi kullanarak yeni sentetik örnekler oluşturur. Ancak, müşterilerle …

1
RandomForest-sklearn'de sınıflandırma eşiği
1) Sklearn'deki RandomForest'te sınıflandırma eşiğini (varsayılan olarak 0,5 olduğunu düşünüyorum) nasıl değiştirebilirim? 2) sklearn'de nasıl yetersiz numune alabilirim? 3) RandomForest sınıflandırıcısından şu sonucu aldım: [[1635 1297] [520 3624]] precision recall f1-score support class 0 0.76 0.56 0.64 2932 class 1 0.74 0.87 0.80 4144 ort / toplam 0,75 0,74 0,73 …

1
SVM ile dengesiz çok sınıflı veri kümesini ele almanın en iyi yolu
Ben dengesiz veri SVMs ile bir tahmin modeli oluşturmak için çalışıyorum. Etiketlerim / çıktımın pozitif, nötr ve negatif olmak üzere üç sınıfı var. Olumlu örneğin verilerimin yaklaşık% 10-20'sini, nötr yaklaşık% 50-60'ını ve negatif yaklaşık% 30-40'ını oluşturduğunu söyleyebilirim. Sınıflar arasında yanlış tahminlerle ilişkili maliyet aynı olmadığı için sınıfları dengelemeye çalışıyorum. Bir …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.