«classification» etiketlenmiş sorular

Yeni bir veri kümesi örneğinin ait olduğu kategoriyi veya kategorileri tanımlayan denetimli öğrenme örneği.

3
Çok partili sistemde seçim sonucunu hesaplamak için hangi regresyon kullanılır?
Parlamento seçimlerinin sonucunu tahmin etmek istiyorum. Çıktım, her bir tarafın aldığı% olacak. 2'den fazla parti var, bu nedenle lojistik regresyon uygulanabilir bir seçenek değil. Her taraf için ayrı bir gerileme yapabilirdim, ancak bu durumda sonuçlar bir şekilde birbirinden bağımsız olur. Sonuçların toplamının% 100 olmasını sağlamaz. Hangi regresyonu (veya başka bir …

3
Bilimsel hesaplama için en iyi diller [kapalı]
Kapalı . Bu sorunun daha fazla odaklanması gerekiyor . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Soruyu, yalnızca bu yayını düzenleyerek tek bir soruna odaklanacak şekilde güncelleyin . 5 yıl önce kapalı . Çoğu dilde bazı bilimsel bilgi işlem kütüphaneleri var gibi görünüyor. Python var Scipy Rust …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

3
Doğrulama kaybında veya doğrulukta erken durdurma?
Şu anda bir sinir ağı eğitimi alıyorum ve Erken Durdurma kriterlerimi uygulamak için hangisinin kullanılacağına karar veremiyorum: doğrulama kaybı veya doğrulama setinde hesaplanan doğruluk / f1score / auc / gibi bir metrik. Araştırmamda her iki görüşü de savunan makaleler buldum. Keras validasyon kaybını temerrüde düşürüyor gibi görünse de karşıt yaklaşım …

3
Veri kümesini ne zaman dengesiz olarak değerlendirmeliyiz?
Veri kümesindeki olumlu ve olumsuz örneklerin sayısının dengesiz olduğu bir durumla karşı karşıyayım. Benim sorum, veri kümesinde bir tür dengelemeyi zorlamak için büyük kategoriyi ne zaman alt örneklememiz gerektiğini bize gösteren herhangi bir başparmak kuralı var. Örnekler: Olumlu örneklerin sayısı 1.000 ve negatif örneklerin sayısı 10.000 ise, sınıflandırıcımı tam veri …

1
R'deki grafikler için kütüphaneler (etiket yayılma algoritmaları / sık sık alt madencilik)
Sorunun genel tanımı Bazı köşeleri 3 veya 4 olası değerleri olan bir tür etiketli bir grafik var. Diğer köşeler için tür bilinmiyor. Amacım, etiketlenmemiş köşelerin türünü tahmin etmek için grafiği kullanmaktır. Olası çerçeve Bunun, literatürü okumama dayanarak etiket yayılım problemlerinin genel çerçevesine uyduğundan şüpheleniyorum (örneğin, bu makaleye ve bu makaleye …

4
Neden birkaç model neredeyse aynı sonuçları verebilir?
Ben ~ 400k kayıtları ve 9 değişkenli bir veri seti analiz ediyorum Bağımlı değişken ikili. Bir lojistik regresyon, bir regresyon ağacı, rastgele bir orman ve gradyan artırılmış bir ağaç taktım. Hepsi, başka bir veri kümesinde doğruladığımda sanal olarak aynı uyum iyiliği değerini verir. Neden böyle? Değişken oranlara ilişkin gözlemlerimin çok …

1
İngilizce bir cümlenin karmaşıklığı nasıl belirlenir?
İnsanların İngilizce'yi ikinci dil olarak öğrenmelerine yardımcı olmak için bir uygulama üzerinde çalışıyorum. Cümlelerin ekstra bağlam sağlayarak bir dil öğrenmeye yardımcı olduğunu doğruladım. Bunu 60 kişilik bir sınıfta küçük bir araştırma yaparak yaptım. Çeşitli İngilizce kelimeler için Wikipedia'dan yüz binden fazla cümle inceledim (Barrons'800 kelime ve en yaygın 1000 İngilizce …

3
En iyi çağrı süresini tahmin edin
Kaliforniya'nın farklı şehirlerinde bir dizi müşteri, her müşteri için arama zamanı ve çağrı durumunu içeren bir veri setim var (müşteri aramayı cevaplarsa Doğru ve müşteri cevap vermezse Yanlış). Gelecekteki müşterileri aramak için uygun bir zaman bulmalıyım ki aramayı cevaplama olasılığı yüksek. Peki, bu sorun için en iyi strateji nedir? Sınıfların …

2
Scikit sınıflandırıcılarının sınıflandırılması ne kadar zaman alır?
1 milyon etiketli belgeden oluşan bir grupta metin sınıflandırması için scikit doğrusal destek vektör makinesi (SVM) sınıflandırıcısı kullanmayı planlıyorum. Ne yapmayı planlıyorum, bir kullanıcı bazı anahtar kelime girdiğinde, sınıflandırıcı ilk önce bir kategoride sınıflandıracak ve daha sonra bu kategori kategorisinin belgelerinde sonraki bilgi alma sorgusu gerçekleşecektir. Bir kaç sorum var: …

1
Çok sınıflı veri kümesinde yanlış sınıflandırmaya neden olan dengesiz veriler
39 kategori / sınıf ve 8.5 milyon kaydım olan metin sınıflandırması üzerinde çalışıyorum. (Gelecekte veri ve kategoriler artacaktır). Verilerimin yapısı veya biçimi aşağıdaki gibidir. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 GB, RAM:4 GB,Primary Camera:12 MP Case cover …

1
Sınıflardan birinin 'diğerlerinden değil' ile tanımlandığı bir sınıflandırma problemine nasıl yaklaşırım?
Üç sınıf , , ilgilendiğimi varsayalım . Ancak veri aslında birkaç gerçek sınıf daha içeriyor .c1c1c_1c2c2c_2c3c3c_3(cj)nj=4(cj)j=4n(c_j)_{j=4}^n Açık cevap, , tüm sınıfları ifade eden yeni bir sınıfı tanımlamaktır , ancak örnekler nadir ve birbirine çok bunun iyi bir fikir olmadığından şüpheleniyorum .c^4c^4\hat c_4cjcjc_jj>3j>3j>3c^4c^4\hat c_4 Söylemeye çalıştığım şeyi görselleştirmek için aşağıdaki iki …

4
Çok değişkenli zaman serilerini sınıflandırır
Yaklaşık 40 boyuta sahip zaman serilerinden (8 puan) oluşan bir veri setim var (bu yüzden her zaman serisi 8 x 40'tır). Karşılık gelen çıkış (kategoriler için olası sonuçlar) eitheir 0 veya 1'dir. Birden fazla boyuta sahip zaman serileri için bir sınıflandırıcı tasarlamak için en iyi yaklaşım hangisidir? İlk stratejim şu …

2
Vektör dizilerinin sınıflandırılması
Veri setim vektör dizilerinden oluşuyor. Her vektörün 50 gerçek değerli boyutu vardır. Bir sekanstaki vektörlerin sayısı 3-5 ila 10-15 arasındadır. Başka bir deyişle, bir dizinin uzunluğu sabit değildir. Bazı adil sekanslar (vektörler değil!) Bir sınıf etiketi ile açıklanır. Benim görevim, bir dizi vektör verilen bir sınıflandırıcıyı öğrenmek, tüm dizi için …

2
Python'da Tamamlayıcı Naif Bayes mi uygulanıyor?
Sorun Suç verileri etiketli bir veri kümesi üzerinde Naive bayes kullanmayı denedim ama gerçekten kötü sonuçlar (% 7 doğruluk) var. Naive Bayes kullandığım diğer alogoritmalardan çok daha hızlı çalışıyor, bu yüzden skorun neden bu kadar düşük olduğunu bulmak istedim. Araştırma Okuduktan sonra daha yüksek frekanslı sınıflar için bir önyargıya sahip …

4
Metin sınıflandırıcı eğitim veri kümeleri önerin
Bir metin sınıflandırıcısını eğitmek için hangi serbestçe kullanılabilen veri kümelerini kullanabilirim? Onun için en alakalı içeriği önererek kullanıcılarımızın katılımını artırmaya çalışıyoruz, bu yüzden içeriğimizi önceden tanımlanmış bir kelime torbasına göre sınıflandırırsak, önceden sınıflandırılmış rastgele sayıda gönderi hakkında geri bildirim alarak içeriğine ilgi çekici bir şekilde geri dönmesini önerebiliriz. önce. Bu …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.