«classification» etiketlenmiş sorular

İstatistiksel sınıflandırma, alt popülasyonunun kimliğinin bilinmediği yeni gözlemlerin ait olduğu alt popülasyonu, alt popülasyonu bilinen gözlemleri içeren veri içeren bir eğitim seti temelinde tanımlama sorunudur. Bu nedenle bu sınıflandırmalar istatistiklerle incelenebilen değişken bir davranış gösterecektir.

1
k-fold Topluluk öğreniminin çapraz doğrulaması
Topluluk öğreniminin k-kat çapraz doğrulaması için verilerin nasıl bölümleneceği konusunda kafam karıştı. Sınıflandırma için bir topluluk öğrenme çerçevem ​​olduğunu varsayarsak. İlk katmanım svm, karar ağaçları gibi sınıflandırma modellerini içeriyor. İkinci katmanım, ilk katmandaki tahminleri birleştiren ve son tahmini veren bir oylama modeli içeriyor. 5 kat çapraz doğrulama kullanırsak, 5 kat …

1
Bir sınıflandırma tekniği olan LDA'nın PCA gibi boyutsallık azaltma tekniği olarak nasıl işlev gördüğü
Bu makalede , yazar doğrusal diskriminant analizini (LDA) temel bileşen analizine (PCA) bağlar. Sınırlı bilgimle, LDA'nın PCA'ya nasıl benzediğini takip edemiyorum. Her zaman LDA'nın lojistik regresyona benzer bir sınıflandırma algoritması olduğunu düşündüm. LDA'nın PCA'ya nasıl benzediğini anlamada bazı yardımları takdir edeceğim, yani boyutsallık azaltma tekniği nasıl.

2
Rastgele orman aşırı uyuyor mu?
Scikit-learn ile rastgele ormanları deniyorum ve eğitim setimin harika sonuçlarını alıyorum, ancak test setimde nispeten zayıf sonuçlar elde ediyorum ... İşte çözmeye çalıştığım problem (pokerden esinlenerek): Oyuncu A'nın delik kartları, oyuncu B'nin delik kartları ve bir flop (3 kart) verildi, hangi oyuncu en iyi ele sahip? Matematiksel olarak, bu 14 …

3
Sınıflandırma için yarı denetimli öğrenme, aktif öğrenme ve derin öğrenme
Tüm kaynaklar güncellendiğinde son düzenleme: Bir proje için, sınıflandırma için makine öğrenimi algoritmaları uyguluyorum. Zorluk: Oldukça sınırlı etiketlenmiş veriler ve çok daha fazla etiketlenmemiş veriler. Hedefler: Yarı denetimli sınıflandırma uygulayın Bir şekilde yarı denetimli etiketleme işlemi uygulayın (aktif öğrenme olarak bilinir) EM, Transductive SVM veya S3VM (Yarı Denetimli SVM) veya …

2
Aşırı Örneklenmiş Dengesizlik Verilerinde Sınıflandırmanın Test Edilmesi
Ciddi dengesiz veriler üzerinde çalışıyorum. Literatürde, yeniden örnekleme (aşırı veya düşük örnekleme) kullanarak verileri yeniden dengelemek için çeşitli yöntemler kullanılmaktadır. İki iyi yaklaşım: SMOTE: Sentetik Azınlık Aşırı Örnekleme Teknikleri ( SMOTE ) ADASYN: Dengesiz Öğrenme için Uyarlanabilir Sentetik Örnekleme Yaklaşımı ( ADASYN ) ADASYN'i uyarladım çünkü uyarlanabilir yapısı ve çok …

7
Makine Öğreniminde Taraflı Veriler
Zaten veri seçimi tarafından (ağırlıklı olarak) önyargılı verilerle bir Makine Öğrenimi projesi üzerinde çalışıyorum. Bir dizi sabit kodlu kuralınız olduğunu varsayalım. Kullanabileceği tüm veriler zaten bu kurallara göre filtrelenmiş veriler olduğunda, bunun yerine bir makine öğrenme modeli nasıl oluşturulur? Her şeyi açıklığa kavuşturmak için en iyi örnek Kredi Riski Değerlendirmesi …

1
Genel olarak Aşırı Örnekleme ve özellikle SMOTE algoritması hakkındaki görüşler [kapalı]
Kapalı . Bu soru görüş temelli . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Bu yayını düzenleyerek gerçekler ve alıntılarla yanıtlanabilmesi için soruyu güncelleyin . 2 yıl önce kapalı . Genel olarak sınıflandırmada ve özellikle SMOTE algoritmasında aşırı örnekleme hakkında ne düşünüyorsunuz? Neden sadece sınıf verilerindeki dengesizliği …

5
Büyük ölçekli metin sınıflandırması
Metin verilerim üzerinde sınıflandırma yapmak istiyorum. 300 classesSınıf başına 200 eğitim dokümanım var 60000 documents in totalve bu muhtemelen çok yüksek boyutlu verilerle sonuçlanacaktır ( 1 milyondan fazla boyutu inceliyor olabiliriz ). Boru hattında aşağıdaki adımları gerçekleştirmek istiyorum (sadece gereksinimlerimin ne olduğu hakkında bir fikir vermek için): Her belgeyi özellik …

10
Sosyal ağ veri kümeleri
Kilitli . Bu soru ve cevapları kilitlidir çünkü soru konu dışıdır, ancak tarihsel önemi vardır. Şu anda yeni yanıtları veya etkileşimleri kabul etmiyor. Sınıflandırma görevleri için tercihen arff formatında sosyal ağ veri kümelerini (twitter, friendfeed, facebook, lastfm, vb.) Arıyorum. UCI ve Google üzerinden yaptığım aramalar şu ana kadar başarılı olamadı …

3
Çok sınıflı bir sınıflandırıcı oluşturmak birkaç ikili sınıflayıcıdan daha mı iyidir?
URL'leri kategorilere ayırmam gerekiyor. Diyelim ki her URL'yi sıfırlamayı planladığım 15 kategorim var. 15 yollu sınıflandırıcı daha mı iyi? Burada 15 etiket var ve her veri noktası için özellikler oluşturmak. Ya da 15 ikili sınıflandırıcı oluşturup, diyelim: Film ya da Film Dışı ve bir sınıflayıcı oluşturmak için bu sınıflandırmalardan aldığım …

2
Sırt regresyon sınıflandırıcısı metin sınıflandırması için neden oldukça iyi çalışıyor?
Metin sınıflandırması için bir deney sırasında, SVM, NB, kNN, vb. parametrelerle ilgili bazı basit ayarlamalar dışında, bu belirli metin sınıflandırma görevindeki her bir sınıflandırıcıyı optimize etme konusunda. Bu sonuç Dikran Marsupial'dan da bahsedildi . İstatistik arka planından gelmiyorum, çevrimiçi bazı materyalleri okuduktan sonra, bunun ana nedenlerini hala anlayamıyorum. Herkes böyle …

2
Gradyan Arttırma ile Sınıflandırma: [0,1]
Soru Gradient Boosting ile ikili sınıflandırma yaparken tahminin aralığında nasıl tutulduğunu anlamak için uğraşıyorum .[ 0 , 1 ][0,1][0,1] İkili bir sınıflandırma problemi üzerinde çalıştığımızı varsayalım ve objektif fonksiyonumuz günlük kaybı, , burada içindeki hedef değişken ve mevcut modelimizdir.y ∈ { 0 , 1 } H- ∑ ybengünlük( Hm( xben) …

1
Test: Sınıflandırıcıya karar sınırını söyleyin
Aşağıdaki 6 karar sınırı verilmiştir. Karar sınırları violett çizgileridir. Noktalar ve çarpılar iki farklı veri kümesidir. Hangisinin bir olduğuna karar vermeliyiz: Doğrusal SVM Çekirdek SVM (2. sıra polinom çekirdeği) Algılayıcı Lojistik regresyon Sinir Ağı (10 düzeltilmiş doğrusal birim içeren 1 gizli katman) Sinir Ağı (10 tanh birimli 1 gizli katman) …

3
Ne zaman bir topluluk sınıflandırıcısı kullanmamalıyım?
Genel olarak, amaç doğru dışı numune tahmin etmek sınıfı üyelik olan bir sınıflandırma problemi, içinde ne zaman gerektiğini değil bir topluluk sınıflandırıcı kullanılır? Bu soru neden Topluluk öğrenmeyi her zaman kullanmıyorsunuz? . Bu soru neden hep toplulukları kullanmadığımızı soruyor. Toplulukların, topluluk dışı bir eşdeğere göre daha kötü (sadece "daha iyi …

1
Naive Bayes ne zaman SVM'den daha iyi performans gösterir?
Baktığım küçük bir metin sınıflandırma probleminde, Naive Bayes bir SVM'ye benzer veya daha yüksek bir performans sergiliyordu ve çok kafam karıştı. Bir algoritmanın diğerine karşı zaferine hangi faktörlerin karar verdiğini merak ediyordum. SVM'ler üzerinde Naive Bayes kullanmanın bir anlamı olmadığı durumlar var mı? Birisi buna ışık tutabilir mi?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.