«classification» etiketlenmiş sorular

Yeni bir veri kümesi örneğinin ait olduğu kategoriyi veya kategorileri tanımlayan denetimli öğrenme örneği.

5
İkili sınıflandırma algoritmasını seçin
Bir ikili sınıflandırma sorunum var: Eğitim setinde yaklaşık 1000 numune İkili, sayısal ve kategorik olmak üzere 10 özellik Bu tür bir problem için hangi algoritma en iyi seçimdir? Varsayılan olarak, nispeten temiz ve gürültülü olmayan veriler için en iyi olduğu düşünülen SVM (nominal özellik değerlerine ikili özelliklere dönüştürülmüş ön) sahip …

5
deniz dibi ısı haritasını büyüt
corr()Orijinal bir df dışında bir df oluşturun . corr()Df 70 X 70 çıktı ve ısı haritası görselleştirmek mümkün değildir ... sns.heatmap(df). Göstermeye çalışırsam corr = df.corr(), tablo ekrana sığmaz ve tüm korelasyonları görebilirim. Boyutundan dfbağımsız olarak tümünü yazdırmanın veya ısı haritasının boyutunu kontrol etmenin bir yolu var mı ?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

5
Performansı artırmak için makine öğreniminde seyrek ve yoğun verileri birleştirme
Kestirimci olan seyrek özelliklerim var, ayrıca kestirimci olan bazı yoğun özelliklere de sahibim. Sınıflandırıcının genel performansını artırmak için bu özellikleri bir araya getirmem gerekiyor. Şimdi, bunları bir araya getirmeye çalıştığımda, yoğun özellikler seyrek özelliklere daha fazla hakim olma eğilimindedir, bu nedenle AUC'de sadece yoğun özelliklere sahip modele kıyasla sadece% 1 …

3
Dengesiz, heterojen Negatif arka plana sahip Tek Sınıf ayrımcı sınıflandırma?
{Protein} dizilerini belirli bir sınıfa (Neuropeptide hormon öncüleri) ait olarak sınıflandırmak için mevcut bir denetimli sınıflandırıcıyı geliştirmeye çalışıyorum. Yaklaşık 13 milyon protein sekansının ("Bilinmeyen / zayıf açıklamalı arkaplan") arka planına karşı yaklaşık 1.150 bilinen "pozitif" veya çeşitli özelliklerle açıklamalı yaklaşık 100.000 gözden geçirilmiş, ilgili protein vardır (ancak açıkça çok az …

6
Birkaç sürekli değişkenin log dönüşümünü almanın arkasındaki sebep nedir?
Bir sınıflandırma problemi yapıyorum ve birçok insanın kodunu ve eğiticilerini okudum. Dikkatimizi çeken tek şey birçok kişi almasıdır np.logveya logsürekli benzeri değişken loan_amountveya applicant_incomevs. Sadece arkasındaki sebebi anlamak istiyorum. Model tahmin doğruluğunu artırmamıza yardımcı olur mu? Zorunlu mu? veya Arkasında mantık var mı? Lütfen mümkünse bazı açıklamalar sağlayın. Teşekkür ederim.


4
Karar ağacı mı yoksa lojistik regresyon mu?
Bir sınıflandırma problemi üzerinde çalışıyorum. Eşit sayıda kategorik değişken ve sürekli değişken içeren bir veri setim var. Hangi tekniği kullanacağımı nasıl bileceğim? karar ağacı ile lojistik regresyon arasındaki ilişki nedir? Lojistik regresyonun sürekli değişken için daha uygun olacağını ve karar ağacının sürekli + kategorik değişken için daha uygun olacağını varsaymak …

2
Kullanıcı profillerini sınıflandırmak / kümelemek için nitelikleri kullanma
Bir web sitesinden ürün satın alan bir kullanıcı veri setim var. Sahip olduğum özellikler kullanıcı kimliği, kullanıcının bölge (eyalet), ürün kategorisi kimliği, ürünün anahtar kelime kimliği, web sitesinin anahtar kelime kimliği ve ürünün harcanan satış tutarıdır. Amaç, "erkek genç oyuncu" veya "evde anne kalmak" gibi kullanıcıların kimliğini belirlemek için bir …

2
Dengesiz veriler için ikili sınıflandırma modeli
Aşağıdaki özelliklere sahip bir veri kümem var: 2.821 pozitif 193.176 numune ile eğitim veri seti 673 pozitif 82.887 örnek ile Veri Kümesini test et 10 özelliği vardır. İkili bir sınıflandırma yapmak istiyorum (0 veya 1). Karşılaştığım sorun, verilerin çok dengesiz olması. Normalleştirme ve bazı özellik mühendisliği ile birlikte verileri ölçekledikten …

1
Naive Bayes Sınıflandırıcısı hesaplamasında sıfır faktörü nasıl ele alınır?
Bir eğitim veri setim varsa ve üzerinde bir Naive Bayes Sınıflandırıcısı eğitirsem ve olasılık sıfır olan bir özellik değerine sahipsem. Daha sonra yeni verilerdeki sınıflandırmayı tahmin etmek istersem bunu nasıl halledebilirim? Sorun şu ki, hesaplamada sıfır varsa, başka bir çözüm bulabilecek başka ne kadar değer aldığım önemli değil, tüm ürün …


3
Veri kümelerini karışık özellik türleriyle sınıflandırmanın en iyi yolu
Metin ve sayısal gibi karışık özellik türlerinden oluşan bir veri kümesini sınıflandırmanın en iyi yolunun ne olduğunu bilmek istiyorum. Metni boole çevirebileceğimi biliyorum, ancak kelime bilgisi çeşitlidir ve veriler çok seyrek olur. Ayrıca, öznitelik türlerini ayrı ayrı sınıflandırmaya ve sonuçları meta-öğrenme teknikleri ile birleştirmeye çalıştım, ancak iyi çalışmadı.

2
neden veri dengesizliğini ele almamız gerekiyor?
Veri dengesizliği ile neden uğraşmamız gerektiğini bilmem gerekiyor. Bununla nasıl başa çıkacağımı ve yukarı örnekleme ya da aşağı örnekleme ya da Smote kullanarak sorunu çözmek için farklı yöntemler biliyorum. Örneğin, 100 hastalığın yüzde 1'inde nadir bir hastalığım varsa ve eğitim setim için dengeli bir veri seti oluşturmaya karar verdiğimi varsayalım: …

3
Sınıflandırma için RBM nasıl kullanılır?
Şu anda Kısıtlı Boltzmann Makineleri ile oynuyorum ve o zamandan beri el yazısı rakamları onunla sınıflandırmayı denemek istiyorum. Oluşturduğum model şimdi oldukça süslü bir üretken model ama onunla nasıl daha ileri gideceğimi bilmiyorum. Gelen bu makalede yazar diyelim, bu iyi bir üretken bir model oluşturduktan sonra, bir " sonra bir …

1
Müşterileri 2 özelliğe ve Zaman serisine göre sınıflandırın
Tasarladığım bir algoritmada bir sonraki adımımın ne olması gerektiği konusunda yardıma ihtiyacım var. NDA'lar nedeniyle fazla bir şey açıklayamıyorum, ancak genel ve anlaşılır olmaya çalışacağım. Temel olarak, algoritmalarda birkaç adımdan sonra, bu var: Sahip olduğum her müşteri ve bir ay boyunca yaptıkları etkinlikler için, ilk adımlar sırasında etkinlikleri birkaç kategoriye …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.