«gbm» etiketlenmiş sorular

Öngörü gücü zayıf olan modelleri güçlü bir öngörü modelinde birleştiren bir algoritma ailesi. En yaygın yaklaşıma gradyan artırma denir ve en yaygın kullanılan zayıf modeller sınıflandırma / regresyon ağaçlarıdır.

2
Gradyan Artırma Ağaçları (GBM) ve Adaboost arasındaki farkların sezgisel açıklamaları
GBM ile Adaboost arasındaki farkları anlamaya çalışıyorum. Bunlar şimdiye dek anladım: Hem önceki modelin hatalarından ders alan ve hem de modellerin ağırlıklı toplamını yapan yükseltme algoritmaları vardır. GBM ve Adaboost, kayıp fonksiyonları dışında oldukça benzerdir. Ancak yine de aralarındaki farklar hakkında bir fikir edinmek benim için zor. Birisi bana sezgisel …
48 boosting  gbm  adaboost 


5
GBM'de etkileşim derinliği ne demektir?
R'de gbm'deki etkileşim derinliği parametresi ile ilgili bir sorum vardı. Bu, özür dilediğim noob bir soru olabilir, ancak bir ağaçtaki terminal düğümlerinin sayısını belirttiğine inandığım parametre, temel olarak X-yolunu gösterir. öngörücüler arasındaki etkileşim? Sadece bunun nasıl çalıştığını anlamaya çalışıyorum. Ek olarak, bu iki faktör değişkeninin tek bir faktörde birleştirilmesi haricinde, …

1
GBM'de n.minobsinnode parametresinin R'deki rolü [kapalı]
Bu sorunun gelecekteki ziyaretçilere yardımcı olması olası değildir; yalnızca küçük bir coğrafi alan, belirli bir zaman anı veya genel olarak İnternet'in dünya çapında izleyicileri için geçerli olmayan olağanüstü dar bir durumla ilgilidir. Bu soruyu daha geniş ölçüde uygulanabilir kılmak için yardım için, için yardım merkezini ziyaret edin . Kapalı 7 …
21 r  gbm 

3
XGBoost vs Python Sklearn eğimli güçlendirilmiş ağaçlar
XGBoost'un nasıl çalıştığını anlamaya çalışıyorum. Degrade artırılmış ağaçların Python sklearn'de nasıl çalıştığını zaten anlıyorum. Benim için net olmayan şey, XGBoost'un aynı şekilde, ancak daha hızlı çalışması veya python uygulaması arasında temel farklılıklar olup olmadığıdır. Bu makaleyi okuduğumda http://learningsys.org/papers/LearningSys_2015_paper_32.pdf Bana öyle geliyor ki XGboost'tan çıkan sonuç Python uygulamasında olduğu gibi, ancak …

2
GBM sınıflandırması dengesiz sınıf boyutlarından muzdarip mi?
Denetimli bir ikili sınıflandırma sorunuyla ilgileniyorum. GBM paketini bireyleri virüs bulaşmamış / virüs bulaşmış olarak sınıflandırmak için kullanmak istiyorum. Enfekte olmuş bireylerden 15 kat daha fazla enfekte olmuşum var. Dengesiz sınıf boyutlarında GBM modellerinin acı çekip çekmediğini merak ediyordum. Bu soruyu cevaplayan bir referans bulamadım. Enfekte olmamış kişilere 1, enfekte …

4
Degrade artırıcı makine doğruluğu, yineleme sayısı arttıkça azalır
Gradyan arttırıcı makine algoritmasını caretR'deki paket üzerinden deniyorum. Küçük bir kolej veri kümesi kullanarak, aşağıdaki kodu koştu: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

4
Makine öğrenimi algoritmaları için tahmin aralıkları
Aşağıda açıklanan sürecin geçerli / kabul edilebilir olup olmadığını ve herhangi bir gerekçe olup olmadığını bilmek istiyorum. Fikir: Denetimli öğrenme algoritmaları verilerle ilgili temel yapıları / dağılımları varsaymaz. Günün sonunda puan tahminleri çıkarırlar. Bir şekilde tahminlerin belirsizliğini ölçmeyi umuyorum. Şimdi, ML modeli oluşturma süreci doğası gereği rastgele (örneğin hiperparametre ayarı …

1
GBM kullanarak GBM paketi ve Caret
Model kullanarak ayar yapıyordum caret, ancak gbmpaketi kullanarak modeli yeniden çalıştırıyorum . Anladığım kadarıyla caretpaketin kullandığı gbmve çıktı aynı olmalı. Bununla birlikte, sadece hızlı bir test çalıştırması data(iris), değerlendirme metriği olarak RMSE ve R ^ 2 kullanılarak modelde yaklaşık% 5 tutarsızlık gösterir. Kısmi bağımlılık grafiklerini kullanmak için en iyi model …

1
GBM Tahmin Aralığı nasıl bulunur?
Caret paketini kullanarak ve tahmin edilen verilerim için tahmin aralıklarını çözmek için bir yöntem bulmak için GBM modelleri ile çalışıyorum. Çok araştırdım ama Rastgele Orman için tahmin aralıkları bulmak için sadece birkaç fikir buldum. Herhangi bir yardım / R kodu büyük mutluluk duyacağız!

4
Genelleştirilmiş bir artırılmış regresyon modelinde ağaç sayısı nasıl seçilir?
GBM'deki ağaç sayısını seçmek için bir strateji var mı? Özellikle, ntreesiçinde argüman Rbireyin gbmfonksiyonu. Neden ntreesen yüksek değere ayarlamamanız gerektiğini anlamıyorum . Daha fazla sayıda ağacın birden fazla GBM'den elde edilen sonuçların değişkenliğini açıkça azalttığını fark ettim. Çok sayıda ağacın aşırı sığmaya yol açacağını düşünmüyorum. Düşüncesi olan var mı?

1
Güçlendirilmiş regresyon ağaçlarının (BRT), genelleştirilmiş hızlandırılmış modellerin (GBM) ve gradyan güçlendirme makinesinin (GBM) mutabakatı
Sorular: Arttırılmış regresyon ağaçları (BRT) ve genelleştirilmiş arttırılmış modeller (GBM) arasındaki farklar nelerdir? Bunlar birbirinin yerine kullanılabilir mi? Biri diğerinin belirli bir şekli mi? Ridgeway neden Friedman'ın daha önce "Gradient Boosting Machine" (GBM) olarak önerdiğini tanımlamak için "Genelleştirilmiş Artırılmış Regresyon Modelleri" (GBM) ifadesini kullandı? Bu iki kısaltma aynıdır, aynı şeyi …

2
Ağaçların güçlendirilmesinde ayar parametreleri için en uygun değerler nasıl bulunur?
Artırıcı ağaçlar modelinde 3 ayar parametresi olduğunu, yani ağaç sayısı (yineleme sayısı) büzülme parametresi bölünme sayısı (her bir kurucu ağacın büyüklüğü) Benim sorum: ayarlama parametrelerinin her biri için, optimal değerini nasıl bulabilirim? Hangi yöntem? Şunu unutmayın: büzülme parametresi ve ağaç sayısı parametresi birlikte çalışır, yani büzülme parametresi için daha küçük …

3
R gbm dağılımı = “adaboost” ile nasıl kullanılır?
Belgeler, dağıtım = "adaboost" ile R gbm'nin 0-1 sınıflandırma problemi için kullanılabileceğini belirtir. Aşağıdaki kod parçasını düşünün: gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000) gbm_predicted <- predict(gbm_algorithm, test_dataset, n.trees = 5000) Tahmini belgede bulunabilir. Gbm Bir tahmin vektörü döndürür. Varsayılan olarak tahminler f …
9 r  gbm 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.