«classification» etiketlenmiş sorular

İstatistiksel sınıflandırma, alt popülasyonunun kimliğinin bilinmediği yeni gözlemlerin ait olduğu alt popülasyonu, alt popülasyonu bilinen gözlemleri içeren veri içeren bir eğitim seti temelinde tanımlama sorunudur. Bu nedenle bu sınıflandırmalar istatistiklerle incelenebilen değişken bir davranış gösterecektir.

1
Haber hikayelerine dayanan bir suç endeksi ve siyasi istikrarsızlık endeksi oluşturmak istiyorum
Ülkemdeki yerel haber web sitelerini taradığım ve bir suç endeksi ve siyasi istikrarsızlık endeksi oluşturmak istediğim bu yan projem var. Projenin bilgi erişim kısmını zaten ele aldım. Benim planım: Denetimsiz konu çıkarımı. Yakın kopya tespiti. Denetimli sınıflandırma ve olay seviyesi (suç / politik - yüksek / orta / düşük). Python …

3
İstatistiksel anlamlılık için iki sınıflandırıcı doğruluk sonucunun t-testi ile karşılaştırılması
İki sınıflandırıcının doğruluğunu istatistiksel anlamlılık açısından karşılaştırmak istiyorum. Her iki sınıflandırıcı da aynı veri kümesinde çalıştırılır. Bu beni okuduğumdan bir örnek t-testi kullanmam gerektiğine inanıyor . Örneğin: Classifier 1: 51% accuracy Classifier 2: 64% accuracy Dataset size: 78,000 Kullanılacak doğru test bu mu? Öyleyse, sınıflandırıcı arasındaki doğruluk farkının önemli olup …



1
AUC'nin yarı uygun bir skorlama kuralı olması ne anlama gelir?
Uygun bir puanlama kuralı, 'gerçek' bir model tarafından en üst düzeye çıkarılan bir kuraldır ve sistemin 'korunmasına' veya oyun oynamaya izin vermez (modelin skoru iyileştirmek için gerçek inancı olduğu gibi kasıtlı olarak farklı sonuçları bildirmek). Brier skoru doğru, doğruluk (oran doğru olarak sınıflandırıldı) uygun değil ve genellikle cesaret kırılıyor. Bazen …

3
Regresyonda sıfır modeli nedir ve sıfır hipotezi ile nasıl ilişkilidir?
Regresyonda sıfır modeli nedir ve sıfır modeli ile sıfır hipotezi arasındaki ilişki nedir? Anladığım için, bu demek oluyor Sürekli yanıt değişkenini tahmin etmek için "yanıt değişkeninin ortalaması" mı kullanıyorsunuz? Ayrık yanıt değişkenlerini tahmin etmede "etiket dağıtımı" mı kullanıyorsunuz? Bu durumda, sıfır hipotezi arasındaki bağlantıların eksik olduğu görülmektedir.

2
'69'daki verilerden genel olarak en son teknoloji
Sinir ağları için çok kritik olan 1969'dan kalma ünlü Minsky ve Papert kitabı "Perceptrons" un içeriğini anlamaya çalışıyorum. Bildiğim kadarıyla, henüz algılayıcı dışında başka genel denetimli öğrenme algoritmaları yoktu: karar ağaçları sadece 70'lerin sonunda, rastgele ormanlar ve SVM'ler 90'larda gerçekten kullanışlı olmaya başladı. Jackknife yöntemi zaten biliniyordu, ancak k-çapraz validasyonu …

1
Bir görüntüdeki pikselleri sınıflandırmak için temel bir Markov Rasgele Alanı eğitimi
Bir görüntüdeki bölgeleri segmentlere ayırmak için Markov Rastgele Alanlarının nasıl kullanılacağını öğrenmeye çalışıyorum. MRF'deki bazı parametreleri veya neden yaptığım beklenti maksimizasyonunun bazen bir çözüme yaklaşamadığını anlamıyorum. Bayes teoreminden başlayarak, , burada pikselin gri tonlama değeri ve bir sınıf etiketi. MRF kullanılarak modellenirken , için bir Gauss dağılımı kullanmayı seçtim .y …


4
Düşük sınıflandırma doğruluğu, sonra ne yapmalı?
Yani, ML alanında bir acemi oldum ve biraz sınıflandırma yapmaya çalışıyorum. Amacım bir spor etkinliğinin sonucunu tahmin etmektir. Bazı tarihsel veriler topladım ve şimdi bir sınıflandırıcı yetiştirmeye çalıştım. Yaklaşık 1200 örnek aldım, bunlardan 0.2 tanesi test amaçlı olarak ayırdım, diğerleri farklı sınıflandırıcılar ile ızgara aramasına (çapraz doğrulama dahil) koydum. Şu …

3
K-kat çapraz doğrulamasında ızgara araması
10 kat çapraz doğrulama ayarında 120 örnek veri kümesi var. Şu anda, ilk yayının eğitim verilerini seçiyorum ve ızgara aramasıyla gama ve C değerlerini seçmek için 5 kat çapraz doğrulama yapıyorum. RBF çekirdeği ile SVM kullanıyorum. Kesinlik, hatırlama bildirmek için on 10 çapraz doğrulama yaptığım için, her kılavuzun eğitim verilerinde …


1
İstatistiksel öğrenme teorisinde, bir test setine aşırı uyum sağlama sorunu yok mu?
MNIST veri kümesini sınıflandırmayla ilgili sorunu ele alalım. Göre Yann LeCun en MNIST bir Web 'Ciresan ve diğ.' Evrimsel Sinir Ağı kullanılarak MNIST test setinde% 0.23 hata oranı elde edildi. olarak ayarlanmış MNIST eğitimini DtrainDtrainD_{train}, olarak ayarlanmış MNIST testini DtestDtestD_{test}, h 1DtrainDtrainD_{train} olarak kullanarak elde ettikleri son hipotezi ve h_ …

1
Sıfır hipotezi altında değiştirilebilir örneklerin ardındaki sezgi nedir?
Permütasyon testleri (randomizasyon testi, yeniden randomizasyon testi veya kesin test olarak da adlandırılır) çok faydalıdır ve örneğin normal dağıtım varsayımı t-testkarşılanmadığında ve değerlerin parametrik olmayan test Mann-Whitney-U-test, daha fazla bilginin kaybolmasına neden olur. Bununla birlikte, bu tür bir test kullanılırken bir ve sadece bir varsayım göz ardı edilmemelidir, örneklerin sıfır …
16 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

5
Eğitim verilerinin arttırılmasının genel sistem doğruluğu üzerinde nasıl bir etkisi vardır?
Birisi benim için olası örneklerle özetleyebilir mi, hangi durumlarda eğitim verilerinin arttırılması genel sistemi iyileştirir? Daha fazla eğitim verisi eklemenin, muhtemelen verilerin üzerine sığabileceğini ve test verileri üzerinde iyi doğruluk sağlayamayacağını ne zaman tespit ederiz? Bu çok spesifik olmayan bir sorudur, ancak belirli bir duruma özgü olarak cevaplamak istiyorsanız, lütfen …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.