«classification» etiketlenmiş sorular

İstatistiksel sınıflandırma, alt popülasyonunun kimliğinin bilinmediği yeni gözlemlerin ait olduğu alt popülasyonu, alt popülasyonu bilinen gözlemleri içeren veri içeren bir eğitim seti temelinde tanımlama sorunudur. Bu nedenle bu sınıflandırmalar istatistiklerle incelenebilen değişken bir davranış gösterecektir.

2
Rastgele Ormanlar için hangi eğitim hatası rapor edilir?
Şu anda randomForestR'de paketi kullanarak bir sınıflandırma sorunu için rastgele ormanlar uyuyorum ve bu modeller için eğitim hatasını nasıl bildireceğinden emin değilim . Komutla aldığım tahminleri kullanarak hesapladığımda eğitim hatam% 0'a yakın: predict(model, data=X_train) X_traineğitim verileri nerede . İlgili bir soruya yanıt olarak, rastgele ormanlar için eğitim hatası metriği olarak …

3
Dengesiz bir ortamda maliyete duyarlı öğrenme için öneriler
Birkaç milyon satır ve ~ 100 sütun içeren bir veri kümem var. Ortak bir sınıfa ait veri kümesindeki örneklerin yaklaşık% 1'ini tespit etmek istiyorum. Minimum hassasiyet kısıtlamam var, ancak çok asimetrik maliyet nedeniyle belirli bir geri çağırma konusunda çok hevesli değilim (10 olumlu maçla kalmadığım sürece!) Bu ortamda önerebileceğiniz bazı …

2
Çapraz doğrulamada ortalama (skorlar) vs Skor (birleştirme)
TLDR: Veri setim oldukça küçük (120) örnektir. 10 kat çapraz doğrulama yaparken aşağıdakileri yapmalıyım: Her test katından çıktıları toplayın, bunları bir vektöre birleştirin ve daha sonra bu tam tahmin vektöründeki hatayı hesaplayın (120 örnek)? Ya da bunun yerine her katta aldığım çıkışlardaki hatayı hesaplamalıyım (kat başına 12 örnekle) ve son …

2
Madeni para çevirerek sınıflandırıcıları birleştirme
Bir makine öğrenimi kursu okuyorum ve ders slaytlarında önerilen kitapla çeliştiğim bilgiler var. Sorun şudur: üç sınıflandırıcı vardır: daha düşük eşik aralıklarında daha iyi performans sağlayan A sınıflandırıcısı , daha yüksek eşik aralıklarında daha iyi performans sağlayan Sınıflandırıcı B , Sınıflandırıcı C bir p-coin çevirerek ve iki sınıflandırıcıdan seçerek elde …

4
Uzun yağ verileri ile sınıflandırma
Dizüstü bilgisayarımda yüz binlerce veri noktası ve yaklaşık on bin özellik ile doğrusal bir sınıflandırıcı eğitmem gerekiyor. Seçeneklerim neler? Bu tür bir problem için son teknoloji nedir? Stokastik degrade iniş umut verici bir yön gibi görünüyor ve benim düşüncem bu son teknoloji: "Pegasos: SVM için Primal Tahmini alt GrAdient SOlver" …

2
Artan özellik sayısı doğruluk düşüşüne neden olur, ancak ön / geri çağırma artar
Makine Öğreniminde yeniyim. Şu anda 3 sınıftaki küçük metinleri NLTK ve python kullanarak pozitif, negatif veya nötr olarak sınıflandırmak için Naive Bayes (NB) sınıflandırıcısı kullanıyorum. Bazı testler yaptıktan sonra, 300.000 örnekten oluşan bir veri kümesiyle (16.924 pozitif 7.477 negatif ve 275.599 nötr), özellik sayısını artırdığımda doğruluk azalır, ancak pozitif ve …

5
Farklı sınıflandırıcıların artılarını ve eksilerini karşılaştırmayı içeren iyi bir kaynak nedir?
Kutudan çıktığı en iyi 2 sınıf sınıflandırıcı nedir? Evet, sanırım bu milyon dolarlık bir soru ve evet, ücretsiz öğle yemeği teoreminin farkında değilim ve önceki soruları da okudum: Uygulamanız için en iyi 2 sınıfı sınıflandırıcı nedir? ve En Kötü sınıflandırıcı Yine de konuyla ilgili daha fazla okumak istiyorum. Farklı sınıflandırıcıların …

4
Zaman serilerinin istatistiksel benzerliği
Birinin periyot, maksimum, minimum, ortalama vb. gerçek veriler varsayılan modele ne kadar uyuyor? Serideki veri noktalarının sayısı 10 ile 50 arasında değişecektir. Benim çok basit bir ilk düşüncem sinüs dalgasının yönlü hareketine bir değer atfetmekti, yani +1 +1 +1 +1 -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 …


2
Sinir ağları ve diğer her şey
Google'dan buna tatmin edici bir cevap bulamadım . Tabii ki elimdeki veriler milyonlarca mertebede ise, derin öğrenme yoludur. Ve büyük veriye sahip olmadığımda belki de makine öğreniminde diğer yöntemleri kullanmanın daha iyi olduğunu okudum. Verilen neden aşırı uydurmadır. Makine öğrenimi: örn. Verilere bakmak, özellik çıkarma, toplanandan yeni özellikler hazırlamak vb. …

3
Destek Vektör Makineleri ve hiper düzlem için Sezgi
Projemde ikili sınıflandırmayı (1 veya 0) tahmin etmek için bir lojistik regresyon modeli oluşturmak istiyorum. 2'si kategorik olmak üzere 15 değişkenim var, geri kalanı sürekli ve ayrık değişkenlerin bir karışımı. Bir lojistik regresyon modeline uymak için SVM, algılayıcı veya doğrusal programlama kullanarak doğrusal ayrılabilirliği kontrol etmem önerildi. Bu, burada lineer …

3
Doğrusal sınıflandırıcılar için, daha büyük katsayılar daha önemli özellikler ima ediyor mu?
Makine öğrenimi üzerinde çalışan bir yazılım mühendisiyim. Anladığım kadarıyla, doğrusal regresyon (OLS gibi) ve doğrusal sınıflandırma (lojistik regresyon ve SVM gibi), eğitimli katsayılar ve özellik değişkenleri arasındaki iç ürüne dayalı bir tahmin yapar :w⃗ w→\vec{w}x⃗ x→\vec{x} y^= f( w⃗ ⋅ x⃗ ) = f( ∑benwbenxben)y^=f(w→⋅x→)=f(∑iwixi) \hat{y} = f(\vec{w} \cdot \vec{x}) …

3
Veri artırımı ve tren-doğrulaması bölünmesi nasıl yapılır?
Makine öğrenimini kullanarak görüntü sınıflandırması yapıyorum. Bazı eğitim verilerim (resimlerim) olduğunu ve verileri eğitim ve doğrulama setlerine böldüğümü varsayalım. Ve ayrıca rastgele döndürmeler ve gürültü enjeksiyonu ile verileri (orijinallerinden yeni görüntüler üretmek) artırmak istiyorum. Güçlendirme çevrimdışı yapılır. Veri güçlendirmeyi yapmanın doğru yolu hangisidir? Önce verileri eğitim ve doğrulama kümelerine ayırın, …


5
Bir dizi girdi için hangi istatistiksel sınıflandırma algoritması doğru / yanlış tahmin edebilir?
Bir dizi girdi verildiğinde, bu dizinin istenen belirli bir özelliğe sahip olup olmadığını belirlemem gerekir. Özellik yalnızca doğru veya yanlış olabilir, yani bir dizinin ait olabileceği yalnızca iki olası sınıf vardır. Dizi ve özellik arasındaki kesin ilişki belirsizdir, ancak bunun çok tutarlı olduğuna ve istatistiksel sınıflandırmaya uygun olması gerektiğine inanıyorum. …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.