«boosting» etiketlenmiş sorular

Zayıf tahmin modellerini güçlü tahmin modeline birleştiren bir algoritma ailesi. En yaygın yaklaşım gradyan artırma olarak adlandırılır ve en yaygın kullanılan zayıf modeller sınıflandırma / regresyon ağaçlarıdır.

4
Degrade artırıcı makine doğruluğu, yineleme sayısı arttıkça azalır
Gradyan arttırıcı makine algoritmasını caretR'deki paket üzerinden deniyorum. Küçük bir kolej veri kümesi kullanarak, aşağıdaki kodu koştu: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
Hangi torbalama algoritmaları Random Forest'ın ardıllarına layık?
Algoritmaları artırmak için, oldukça iyi geliştiklerini söyleyebilirim. 1995'in başlarında AdaBoost tanıtıldı, bir süre sonra Gradient Boosting Machine (GBM) oldu. Son zamanlarda, doğru, aşırı uyumu ele alan ve birden fazla Kaggle yarışmasının galibi haline gelen XGBoost 2015 civarında piyasaya sürüldü. 2017 yılında LightGBM Microsoft tarafından tanıtıldı, XGBoost'a kıyasla önemli ölçüde daha …

1
AdaBoost'u ne zaman kullanmak istersiniz?
AdaBoost sınıflandırıcısının işte defalarca belirtildiği gibi duyduğum gibi, nasıl çalıştığı ve ne zaman kullanılacağı konusunda daha iyi bir fikir edinmek istedim. Devam ettim ve Google'da bulduğum birkaç makaleyi ve öğreticiyi okudum, ancak sınıflandırıcının hala anlamada sorun yaşadığım yönleri var: Gördüğüm çoğu öğretici, AdaBoost'u birçok sınıflandırıcının en iyi ağırlıklı kombinasyonunu bulmaktan …




3
Rasgele Orman ve Yükseltme parametrik mi yoksa parametrik değil mi?
Mükemmel İstatistiksel modellemeyi okuyarak : İki kültür (Breiman 2001) , geleneksel istatistiksel modeller (örneğin, doğrusal regresyon) ve makine öğrenme algoritmaları (örneğin, Torbalama, Rastgele Orman, Artırılmış ağaçlar ...) arasındaki tüm farkı ele geçirebiliriz. Breiman, veri modellerini (parametrik) eleştirir, çünkü gözlemlerin, İstatistikçi tarafından reçete edilen, Doğayı zayıf bir şekilde taklit edebilecek bilinen, …

1
Neden her zaman topluluk öğrenmesini kullanmıyorsunuz?
Bana öyle geliyor ki, topluluk öğrenimi her zaman tek bir öğrenme hipotezinden daha iyi tahmin performansı verecek. Peki, neden onları sürekli kullanmıyoruz? Benim tahminim belki hesaplama sınırlamaları yüzünden mi? (o zaman bile zayıf tahmin ediciler kullanıyoruz, bu yüzden bilmiyorum).

9
Python'da karar ağaçları artırıldı mı? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. 6 ay önce kapalı . Güçlendirilmiş karar ağaçlarının eğitimi için iyi bir python kütüphanesi var mı?
13 python  cart  boosting 

2
Karar Ağaçları için kategorik özellikleri kodlamak için en iyi uygulamalar?
Doğrusal regresyon için kategorik özellikleri kodlarken, bir kural vardır: aptal sayısı toplam düzey sayısından daha az olmalıdır (eşzamanlılığı önlemek için). Karar Ağaçları için benzer bir kural var mı (torbalanmış, güçlendirilmiş)? Bunu soruyorum çünkü Python'daki standart bir uygulama, nseviyeleri benim için yetersiz görünen nmankenlere (sklearns ' OneHotEncoderveya Pandas' pd.get_dummies) genişletmek gibi …

5
Otomatik makine öğrenimi bir rüya mı?
Makine öğrenimini keşfettiğim gibi farklı ilginç teknikler görüyorum: algoritmaları otomatik olarak grid search, Daha doğru aynı "tip" farklı algoritmalar kombinasyonu ile sonuçlarını en olsun boosting, O en, (algoritmaların fakat aynı tip) farklı algoritmalar kombinasyonu ile daha doğru sonuçlar elde stacking, ve muhtemelen daha fazlasını keşfetmem gerek ... Sorum şu: tüm …

3
Artırma yöntemi neden aykırı değerlere duyarlıdır?
Artırma yöntemlerinin aykırı değerlere duyarlı olduğunu söyleyen birçok makale buldum, ancak nedenini açıklayan bir makale yok. Deneyimlerime göre aykırı değerler herhangi bir makine öğrenimi algoritması için kötüdür, ancak artırma yöntemleri neden özellikle hassastır? Aşağıdaki algoritmalar aykırı değerlere duyarlılık açısından nasıl sıralanır: boost ağacı, rastgele orman, sinir ağı, SVM ve lojistik …


1
Karar kütüğünü Adaboost'ta zayıf öğrenci olarak nasıl kullanabilirim?
Karar Güdük kullanarak Adaboost uygulamak istiyorum. Adaboost'un her yinelemesinde veri setimizin özellikleri kadar karar kütüğü yapmak doğru mu? Örneğin, 24 özellikli bir veri kümem varsa, her yinelemede 24 karar kütüğü sınıflandırıcısı olmalı mı? Yoksa rastgele olarak bazı özellikleri seçmeli ve tüm özellikler yerine sınıflandırıcı yapmalı mıyım?

2
Sınıflandırma için Adaboost'u SVM ile kullanma
Adaboost'un bir dizi zayıf sınıflandırıcının doğrusal bir kombinasyonunu kullanarak güçlü bir sınıflandırıcı oluşturmaya çalıştığını biliyorum . Ancak, bazı durumlarda ve durumlarda Adaboost ve SVM'lerin (SVM güçlü bir sınıflandırıcı olmasına rağmen) uyum içinde çalıştığını gösteren bazı makaleler okudum . Birlikte nasıl çalıştıklarını mimari ve programlama perspektifinden kavrayamıyorum. Birlikte nasıl çalıştıklarını net …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.