«ensemble» etiketlenmiş sorular

Makine öğreniminde, topluluk yöntemleri bir tahminde bulunmak için çoklu algoritmaları birleştirir. Torbalama, artırma ve istifleme bazı örneklerdir.

4
Doğrusal Regresyonlara Rastgele Orman Metodolojisi Uygulanabilir mi?
Rastgele Ormanlar, orijinal eğitim verilerinin önyükleme örneği (hem girdi değişkenlerinin hem de gözlemlerin örnekleri) kullanılarak her ağacın oluşturulduğu bir dizi karar ağacı oluşturarak çalışır. Benzer bir süreç doğrusal regresyon için de uygulanabilir mi? Her k regresyonu için rastgele bir bootstrap örneği kullanarak k lineer regresyon modelleri oluşturun "Rastgele regresyon" benzeri …

1
Rasgele ormanda LASSO kullanımı
Aşağıdaki işlemi kullanarak rastgele bir orman oluşturmak istiyorum: Bölmeleri belirlemek için bilgi kazancı kullanarak rastgele veri ve özellik örnekleri üzerinde bir ağaç oluşturun Bir yaprak düğümünü önceden tanımlanmış bir derinliği aşarsa YA DA herhangi bir ayrım, önceden tanımlanmış minimum değerden daha az bir yaprak sayısıyla sonuçlanır Her ağaç için bir …

1
Neden her zaman topluluk öğrenmesini kullanmıyorsunuz?
Bana öyle geliyor ki, topluluk öğrenimi her zaman tek bir öğrenme hipotezinden daha iyi tahmin performansı verecek. Peki, neden onları sürekli kullanmıyoruz? Benim tahminim belki hesaplama sınırlamaları yüzünden mi? (o zaman bile zayıf tahmin ediciler kullanıyoruz, bu yüzden bilmiyorum).

6
Topluluk yöntemlerinin nasıl uygulanacağını öğrenmek için kaynaklar
Teorik olarak (nasıl çalışacaklarını) anlıyorum, ama aslında bir topluluk yöntemini (oylama, ağırlıklı karışımlar, vb.) Kullanmayı nasıl yapacağımdan emin değilim. Topluluk yöntemlerini uygulamak için iyi kaynaklar nelerdir? Python'da uygulama ile ilgili belirli kaynaklar var mı? DÜZENLE: Bazı yorumlarda tartışmaya dayanarak temizlemek için, randomForest, vb gibi topluluk algoritmaları aramıyorum. Bunun yerine, farklı …

2
Model oluşturmak için regresyon katsayılarının ortalamasında teorik bir problem var mı?
Her biri tam verinin bir alt kümesine dayanan, birden çok OLS modelinin ortalaması olan bir regresyon modeli oluşturmak istiyorum. Bunun arkasındaki fikir bu makaleye dayanmaktadır . K kıvrımları oluşturuyorum ve her biri kıvrımlardan biri olmayan verilerde k OLS modelleri oluşturuyorum. Daha sonra son modeli elde etmek için regresyon katsayılarını ortalarım. …

3
Topluluk zaman serisi modeli
Zaman serisi tahminini otomatikleştirmem gerekiyor ve bu serilerin özelliklerini (mevsimsellik, trend, gürültü, vb.) Önceden bilmiyorum. Amacım her dizi için mümkün olan en iyi modeli elde etmek değil, oldukça kötü modellerden kaçınmaktır. Diğer bir deyişle, her seferinde küçük hatalar almak sorun değil, arada sırada büyük hatalar almaktır. Bunu farklı tekniklerle hesaplanan …

1
Topluluk Öğrenimi: Model İstifleme Neden Etkili?
Son zamanlarda, bir grup öğrenme biçimi olarak model istifleme ile ilgilenmeye başladım. Özellikle, regresyon sorunları için bazı oyuncak veri setleri ile biraz deney yaptım. Temel olarak bireysel "seviye 0" regresörleri uyguladım, her regresörün çıkış tahminlerini "meta-regresörün" girişi olarak almak için yeni bir özellik olarak sakladım ve bu meta-regresörü bu yeni …

3
Küçük n, büyük p problemlerinde ağaç temelli topluluk yöntemlerinin sınırları?
Rastgele Orman ve sonraki türevler (örn. Koşullu orman) gibi ağaç temelli topluluk yöntemleri , göreceli değişken önemini tanımlamak için sözde "küçük n , büyük p " problemlerinde faydalıdır . Aslında, durum böyle görünüyor, ama sorum şu ki bu yetenek ne kadar ileri götürülebilir? Örneğin 30 gözlem ve 100 değişken olabilir …

1
Gözlenen ve beklenen olayları nasıl karşılaştırırım?
Diyelim ki 4 olası olayın sıklık örneğine sahibim: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 ve olaylarımın gerçekleşmesi için beklenen olasılıklarım var: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dört olayın gözlemlenen frekanslarının toplamı ile (18) Olayların beklenen frekanslarını hesaplayabilir …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.