«classification» etiketlenmiş sorular

İstatistiksel sınıflandırma, alt popülasyonunun kimliğinin bilinmediği yeni gözlemlerin ait olduğu alt popülasyonu, alt popülasyonu bilinen gözlemleri içeren veri içeren bir eğitim seti temelinde tanımlama sorunudur. Bu nedenle bu sınıflandırmalar istatistiklerle incelenebilen değişken bir davranış gösterecektir.


2
Doğruluk = 1- test hata oranı
Bu çok açık bir soru olsa özür dilerim, ama çeşitli yazıları okuyorum ve iyi bir onay bulamıyorum. Sınıflandırma durumunda, bir sınıflandırıcının doğruluğu = 1- test hata oranı var mı? Bu doğruluk , ama sorum tam olarak ne kadar doğruluk ve test hata oranı ile ilgilidir. TP+TNP+NTP+TNP+N\frac{TP+TN}{P+N}


2
Sınıflandırma ve regresyon ağaçlarının arkasındaki matematik
Herkes CART'ta sınıflandırmanın ardındaki bazı matematiği açıklamaya yardımcı olabilir mi? İki ana aşamanın nasıl gerçekleştiğini anlamak istiyorum. Örneğin, bir veri kümesi üzerinde bir CART sınıflandırıcısı eğittim ve tahmini performansını işaretlemek için bir test veri kümesi kullandım ancak: Ağacın ilk kökü nasıl seçilir? Her dal neden ve nasıl oluşturulur? 15 sütun …

4
Doğrulukta iyileşmenin önemli olup olmadığını kontrol etme
Her şeyi iki kategoriye ayıran bir algoritmam olduğunu varsayalım. Diyelim ki 1000 test nesnesi üzerinde algoritmanın doğruluğunu ölçebilirim - düşünelim ki şeylerin% 80'i doğru sınıflandırılmıştır. Diyelim ki algoritmayı bir şekilde değiştiriyorum, böylece şeylerin% 81'i doğru bir şekilde sınıflandırılıyor. İstatistikler algoritmadaki gelişimimin istatistiksel olarak anlamlı olup olmadığı hakkında bir şey söyleyebilir …

4
Bir ROC eğrisi nasıl yorumlanır?
SAS'daki verilerime lojistik regresyon uyguladım ve işte ROC eğrisi ve sınıflandırma tablosu. Sınıflandırma tablosundaki rakamlarla rahatım, ancak roc eğrisinin ve altındaki alanın tam olarak ne olduğundan emin değilim. Herhangi bir açıklama büyük mutluluk duyacağız.


2
Naive Bayes sürekli değişkenlerle nasıl çalışır?
Benim (çok temel) anlayışım için, Naive Bayes olasılıkları eğitim verilerindeki her özelliğin sınıf frekanslarına göre tahmin ediyor. Fakat sürekli değişkenlerin sıklığını nasıl hesaplar? Tahmin yaparken, eğitim setinde herhangi bir gözlemin aynı değerlerine sahip olmayabilecek yeni bir gözlem nasıl sınıflandırılır? Bir tür mesafe ölçüsü kullanıyor mu veya 1NN'yi mi buluyor?


1
ROC eğrileri birbirini geçtiğinde iki modelin karşılaştırılması
İki veya daha fazla sınıflandırma modelini karşılaştırmak için kullanılan yaygın bir önlem, ROC eğrisi (AUC) altındaki alanı, performanslarını dolaylı olarak değerlendirmenin bir yolu olarak kullanmaktır. Bu durumda, daha büyük bir AUC'ye sahip bir model genellikle daha küçük bir AUC'ye sahip bir modelden daha iyi performans olarak yorumlanır. Ancak, Vihinen, 2012'ye …

4
Doğrusal olmayan modeller kullanılırken çoklu-eş-doğrusallıktan endişe edilmeli mi?
Diyelim ki çoğunlukla kategorik özelliklere sahip bir ikili sınıflandırma problemimiz var. Öğrenmek için bazı doğrusal olmayan modeller (örneğin, XGBoost veya Rastgele Ormanlar) kullanıyoruz. Kişi hala çok eşbiçimli olma konusunda endişelenmeli mi? Neden? Yukarıdakilerin cevabı doğruysa, bu tip doğrusal olmayan modelleri kullandığını düşünerek nasıl mücadele etmeliyiz?

3
Makine öğrenimi modelleri (GBM, NN vb.) Hayatta kalma analizi için nasıl kullanılabilir?
Ben Cox Orantılı Tehlike regresyon & bazı Kaplan-Meier modelleri gibi bu geleneksel istatistiksel modeller bir olay diyelim başarısızlık sonraki geçtiği kadar gün tahmin etmek için kullanılabilir biliyorum vs. yani Survival analizi Sorular GBM, Yapay sinir ağları vb. Makine öğrenimi modellerinin regresyon versiyonu bir olayın gerçekleşmesine kadar geçen günleri tahmin etmek …

1
Derin ağ LSTM katmanı nasıl eğitilir
Metin sınıflandırmak için bir lstm ve ileri beslemeli ağ kullanıyorum. Metni tek sıcak vektörlere dönüştürüyorum ve her birini lstm'ye besliyorum, böylece tek bir gösterim olarak özetleyebiliyorum. Sonra diğer ağa besliyorum. Ama lstm'yi nasıl eğitebilirim? Metni sıralamak istiyorum - eğitim yapmadan mı beslemeliyim? Ben sadece sınıflandırıcı giriş katmanına besleyebilir tek bir …

2
Düzeltme paketi kullanılarak belirli eşik değerleri için karışıklık matrisleri elde etmek mümkün müdür?
Bir lojistik regresyon modeli (yoluyla elde ettik trainbir ikili yanıt için), ve ile lojistik karışıklık matrisi elde ettik confusionMatrixiçinde caret. Bana lojistik modeli karışıklık matrisi veriyor, ancak bunu elde etmek için hangi eşiğin kullanıldığından emin değilim. Nasıl kullanarak belirli eşik değerleri için karışıklık matrisi elde do confusionMatrixin caret?


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.