«classification» etiketlenmiş sorular

İstatistiksel sınıflandırma, alt popülasyonunun kimliğinin bilinmediği yeni gözlemlerin ait olduğu alt popülasyonu, alt popülasyonu bilinen gözlemleri içeren veri içeren bir eğitim seti temelinde tanımlama sorunudur. Bu nedenle bu sınıflandırmalar istatistiklerle incelenebilen değişken bir davranış gösterecektir.

2
CART ağaçları tahmin ediciler arasındaki etkileşimleri yakalar mı?
Bu makale , CART'ta, her adımda tek bir ortak değişken üzerinde ikili bir bölünme gerçekleştirildiğinden, tüm bölünmelerin dik olduğunu ve bu nedenle ortak değişkenler arasındaki etkileşimlerin dikkate alınmadığını iddia etmektedir. Bununla birlikte, birçok ciddi referans, aksine, bir ağacın hiyerarşik yapısının, öngörücüler arasındaki etkileşimlerin otomatik olarak modellenmesini (örneğin, bu makale ve …

3
Dikdörtgenin VC boyutu
Ethem Alpaydın'ın "Makine Öğrenmesine Giriş" kitabı, eksene hizalanmış bir dikdörtgenin VC boyutunun 4 olduğunu belirtir. Ancak, bir dikdörtgen, alternatif pozitif ve negatif noktalarla dört eş doğrusal nokta kümesini nasıl parçalayabilir? Birisi bir dikdörtgenin VC boyutunu açıklayabilir ve kanıtlayabilir mi?


1
LDA'yı ön işleme adımı olarak kullanırken özellikleri standartlaştırma
Boyutsallık azalması (veya PCA yoluyla boyutsallık azalmasından sonra dönüşüm) için çok sınıflı bir Lineer Diskriminant Analizi (veya bazen Birden Çok Diskriminant Analizi de okurum) kullanılıyorsa, genel olarak bir "Z skoru normalizasyonu" (veya standardizasyonu) özellikler tamamen farklı ölçeklerde ölçülseler bile gerekli değil mi? LDA, halihazırda normalleştirilmiş Öklid mesafelerini ima eden Mahalanobis …

1
RandomForest-sklearn'de sınıflandırma eşiği
1) Sklearn'deki RandomForest'te sınıflandırma eşiğini (varsayılan olarak 0,5 olduğunu düşünüyorum) nasıl değiştirebilirim? 2) sklearn'de nasıl yetersiz numune alabilirim? 3) RandomForest sınıflandırıcısından şu sonucu aldım: [[1635 1297] [520 3624]] precision recall f1-score support class 0 0.76 0.56 0.64 2932 class 1 0.74 0.87 0.80 4144 ort / toplam 0,75 0,74 0,73 …

3
Lojistik regresyon: gerçek pozitifleri en üst düzeye çıkarmak - yanlış pozitifler
Bir lojistik regresyon modelim var (elastik net regülasyonlu R'de glmnet ile uyumlu) ve gerçek pozitifler ve yanlış pozitifler arasındaki farkı en üst düzeye çıkarmak istiyorum. Bunu yapmak için aşağıdaki prosedür akla geldi: Standart lojistik regresyon modeline uygun Tahmin eşiğini 0,5 olarak kullanarak, tüm pozitif tahminleri belirleyin Olumlu tahmin edilen gözlemler …

2
Hassasiyet ve özgüllüğü birleştiren sınıflandırıcı performans ölçüsü mü?
Birden fazla sınıflandırıcı kullanarak sınıflandırma yaptığım 2 sınıf etiketli veri var. Ve veri kümeleri dengelidir. Sınıflandırıcıların performansını değerlendirirken, sınıflandırıcının sadece gerçek pozitifleri değil, aynı zamanda gerçek negatifleri de belirlemede ne kadar doğru olduğunu göz önünde bulundurmam gerekir. Bu nedenle, doğruluk kullanırsam ve sınıflandırıcı pozitiflere karşı önyargılıysa ve her şeyi pozitif …

5
Sınıf etiketlerinin yaklaşık% 100'ü bir sınıfa ait olduğunda bir sınıflandırıcının performansı nasıl ölçülür?
Verilerimde, olarak belirtilen bir sınıf değişkenim var . Bu sınıf değişkeni değerleri (ikili) şeklindedir. neredeyse tüm gözlemleri 0'dır (% 100'e yakın, daha kesin olarak% 97). Farklı sınıflandırma modelleri üzerinde bir "performans" testi istiyorum (doğruluk olabilir). Olmaktan korktuğum, gözlemleri her zaman sınıf 0'da sınıflandıran bir sınıflandırma modelim varsa, o zaman bu …

2
İkili sınıflandırma sorunu için hangi SVM çekirdeği kullanılır?
Vektör makinelerini destekleme konusunda yeni başlayan biriyim. Belirli bir soruna hangi çekirdeğin (örn. Doğrusal, polinom) en uygun olduğunu söyleyen bazı yönergeler var mı? Benim durumumda, web sayfalarını belirli bilgiler içerip içermediklerine göre sınıflandırmak zorundayım, yani ikili bir sınıflandırma sorunum var. Genel olarak bu göreve hangi çekirdeğin en uygun olduğunu söyleyebilir …

1
Olay tahmini için hayatta kalma analizi
Veri kümelerimdeki her kayıt için aşağıdaki bilgilere sahibim (X1 ,… ,Xm ,δ ,T )(X1 ,… ,Xm ,δ ,T ) (X_1 \ , \dots \ , X_m \ , \delta \ , T \ ) nerede XiXiX_i özellikler, δδ\delta hedef olay meydana gelirse 1, aksi takdirde 0 olur ve TTTgerçekleşen olayın …

2
İlişkisel verilerden öğrenme
Ayarlar Birçok algoritma tek bir ilişki veya tablo üzerinde çalışırken, gerçek dünyadaki birçok veritabanı bilgileri birden çok tabloda depolar (Domingos, 2003). Question Ne tür algoritmalar çoklu (ilişkisel) tablolardan iyi öğrenir. Özellikle, regresyon ve sınıflandırma görevleri için geçerli olan algoritmalarla ilgileniyorum (ağ analizine yönelik olanlar değil, örneğin bağlantı tahmini). Aşağıda listelenen …

1
Gözlenen ve beklenen olayları nasıl karşılaştırırım?
Diyelim ki 4 olası olayın sıklık örneğine sahibim: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 ve olaylarımın gerçekleşmesi için beklenen olasılıklarım var: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dört olayın gözlemlenen frekanslarının toplamı ile (18) Olayların beklenen frekanslarını hesaplayabilir …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
Bir baskın yordayıcı ile sınıflandırma
Bir (kkk-sınıf) sınıflandırma problemi, bir tanesi diğerlerinden çok daha fazla açıklayıcı güce sahip gibi görünen 100 gerçek değerli tahminci sırasına göre. Diğer değişkenlerin etkilerini derinleştirmek istiyorum. Bununla birlikte, standart makine öğrenme teknikleri (rastgele ormanlar, SVM'ler, vb.) Bir güçlü öngörücü tarafından gömülüyor ve bana diğerleri hakkında çok ilginç bilgi vermiyor. Eğer …

2
Sınıflandırma için eğitim setinden kopyaları kaldırın
Diyelim ki bir sınıflandırma problemi için birkaç satırım var: X1, . . .XN-, YX1,...XN,YX_1, ... X_N, Y Nerede X1, . . . ,XN-X1,...,XNX_1, ..., X_N özellikler / öngörücüler ve YYY satırın özellik kombinasyonunun ait olduğu sınıftır. Birçok özellik kombinasyonu ve sınıfları bir sınıflandırıcı sığdırmak için kullandığım veri kümesinde tekrarlanır. Ben …

2
Bir zaman serisinin sıfır ortalama bölümünü bulmak için en son teknoloji yöntem (ler)
Ben sıfır ortalama ile bu bölümlere ve sıfır ortalama olmayan bu bölümlere bölümlere gerekir gürültülü zaman serisi var. Sınırları olabildiğince doğru bulmak önemlidir (sınırın tam olarak yattığı yer biraz özneldir). Bence bir cusum varyantı bunu yapmak için uyarlanabilir, çünkü cusum öncelikle tüm segmentasyon stratejisini tamamen unutulmamış bırakan tek değişiklikler bulmakla …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.