«classification» etiketlenmiş sorular

İstatistiksel sınıflandırma, alt popülasyonunun kimliğinin bilinmediği yeni gözlemlerin ait olduğu alt popülasyonu, alt popülasyonu bilinen gözlemleri içeren veri içeren bir eğitim seti temelinde tanımlama sorunudur. Bu nedenle bu sınıflandırmalar istatistiklerle incelenebilen değişken bir davranış gösterecektir.

2
DDoS filtrelemesi için makine öğrenimi uygulama
In Stanford Yapay Öğrenme kursu Andrew Ng IT ML uygulayarak söz. Bir süre sonra sitemizde orta büyüklükte (yaklaşık 20 bin bot) DDoS aldığımda basit Sinir Ağı sınıflandırıcısını kullanarak buna karşı savaşmaya karar verdim. Bu python betiğini yaklaşık 30 dakika içinde yazdım: https://github.com/SaveTheRbtz/junk/tree/master/neural_networks_vs_ddos PyBrain kullanır ve ikisi Sinir Ağı'nı eğitmek için …



1
T-SNE'nin sınıfları iyi ayırdığını gördükten sonra hangi sınıflandırma algoritması kullanılmalıdır?
Bir sınıflandırma problemimiz olduğunu varsayalım ve ilk önce verilerden bir fikir edinmek istiyoruz ve t-SNE yapıyoruz. T-SNE'nin sonucu sınıfları çok iyi ayırır. Bu, sınıfları da çok iyi ayıracak sınıflandırma modeli oluşturmanın mümkün olduğu anlamına gelir (t-SNE iyi ayrılmazsa, çok fazla ima etmez). T-SNE'nin yerel yapıya odaklandığını ve sınıfları iyi ayırabildiğini …

2
ikili sınıflandırma problemlerinde auc ve logloss optimizasyonu
Sonuç olasılığının oldukça düşük olduğu bir ikili sınıflandırma görevi yapıyorum (yaklaşık% 3). AUC veya log-loss ile optimize olup olmadığına karar vermeye çalışıyorum. Anladığım kadarıyla, AUC, modelin sınıflar arasında ayrım yapma yeteneğini en üst düzeye çıkarırken, mantık gerçek ve tahmini olasılıklar arasındaki farklılığı cezalandırıyor. Benim görevimde hassas doğruluğu kalibre etmek son …

1
Yanlış pozitif sayısı nasıl azaltılır?
Yaya tespiti olarak adlandırılan görevi çözmeye çalışıyorum ve iki kategori pozitif - insanlar, negatifler - arka plan üzerinde ikili clasifer eğitiyorum. Veri setim var: pozitif sayısı = 3752 negatif sayısı = 3800 Train \ test split 80 \ 20% ve RandomForestClassifier form scikit-learn parametrelerini kullanıyorum: RandomForestClassifier(n_estimators=100, max_depth=50, n_jobs= -1) Puanı …

1
Rasgele ormanlarla (veya başka bir sınıflandırıcıyla) katmanlı sınıflandırma
Yani, yaklaşık 60 x 1000 matrisim var. 1000 özellikli 60 nesne olarak bakıyorum; 60 nesne 3 sınıfa ayrılır (a, b, c). Her sınıfta 20 nesne ve gerçek sınıflandırmayı biliyoruz. Bu 60 eğitim örneği seti üzerinde denetimli öğrenme yapmak istiyorum ve hem sınıflandırıcı doğruluğu (ve ilgili metrikler) hem de 1000 özellikte …

3
Çok küçük setlerde aykırı algılama
On iki örnek parlaklık değeri verildiğinde esas olarak kararlı bir ışık kaynağının parlaklığı için olabildiğince doğru bir değer elde etmeliyim. Sensör kusurlu ve ışık zaman zaman daha parlak veya daha karanlık "titreyebilir", bu da göz ardı edilebilir, bu nedenle daha fazla algılama ihtiyacım var (sanırım?). Burada çeşitli yaklaşımları okudum ve …


3
VC boyutu neden önemlidir?
Wikipedia şunları söylüyor: VC boyutu, bir algoritmanın paramparça edebileceği en büyük nokta kümesinin temelidir. Örneğin, doğrusal bir sınıflandırıcı n + 1 kardinalitesine sahiptir. Sorum şu, neden önemsiyoruz? Doğrusal sınıflandırma yaptığınız çoğu veri kümesi çok büyüktür ve çok fazla nokta içerir.

3
Çok sınıflı bir sınıflandırıcı için bir karışıklık matrisi nasıl oluşturulur?
6 sınıfla ilgili bir sorunum var. Bu yüzden, aşağıdaki gibi bir çok sınıflı sınıflandırıcı inşa: Her sınıf için, One vs. All kullanarak bir Lojistik Regresyon sınıflandırıcı var, bu da 6 farklı sınıflandırıcılar var demektir. Sınıflandırıcılarımın her biri için bir karışıklık matrisi rapor edebilirim. Ancak, burada bir çok örnekte gördüğüm gibi, …

1
Karar kütüğünü Adaboost'ta zayıf öğrenci olarak nasıl kullanabilirim?
Karar Güdük kullanarak Adaboost uygulamak istiyorum. Adaboost'un her yinelemesinde veri setimizin özellikleri kadar karar kütüğü yapmak doğru mu? Örneğin, 24 özellikli bir veri kümem varsa, her yinelemede 24 karar kütüğü sınıflandırıcısı olmalı mı? Yoksa rastgele olarak bazı özellikleri seçmeli ve tüm özellikler yerine sınıflandırıcı yapmalı mıyım?

5
Boş hipotezi neden 0.5 düzeyinde değil, 0.05 düzeyinde reddediyoruz (Sınıflandırmada yaptığımız gibi)
Hipotez testi bir Sınıflandırma problemine benzer. Diyelim ki bir gözlem (konu) için 2 olası etiketimiz var - Suçlu ve Suçsuz. Suçlu Olmamanın boş Hipotez olmasına izin verin. Sorunu bir Sınıflandırma bakış açısından incelersek, Veriler göz önüne alındığında, 2 Sınıfın her birine ait konunun olasılığını tahmin edecek bir Sınıflandırıcıyı eğitirdik. Daha …

2
R'de sınıflandırma modelleri için artımlı öğrenme
Aşağıdaki kodu kullanarak sahtekarlık tespiti için bir sınıflandırıcı (Karar ağacı, rastgele orman, lojistik regresyon gibi standart sınıflandırıcılardan herhangi biri olabilir) varsayalım library(randomForest) rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier Say, Y is a binary outcome - Fraud/Not-Fraud Şimdi, görünmeyen bir veri …

2
Bayes Sınıflandırıcı neden ideal sınıflandırıcıdır?
Kategorilerin altında yatan olasılık yapısının mükemmel olarak bilindiği ideal bir durum olarak kabul edilir. Neden Bayes sınıflandırıcısı ile elde edilebilecek en iyi performansı elde ediyoruz? Bunun resmi kanıtı / açıklaması nedir? Her zaman Bayes sınıflandırıcısını diğer tüm sınıflandırıcıların performansını karşılaştırmak için bir referans olarak kullandığımızdan.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.