«cart» etiketlenmiş sorular

'Sınıflandırma ve Regresyon Ağaçları'. CART popüler bir makine öğrenim tekniğidir ve rastgele ormanlar ve eğim artırma makinelerinin ortak uygulamaları gibi tekniklerin temelini oluşturur.

1
Hangi uygulamalarda karar ağacı değişkeni (özellik) ölçeklemesi ve değişken (özellik) normalizasyonu (ayarlama) gerekir?
Birçok makine öğrenme algoritmaları, özellik ölçekleme (aka değişken ölçekleme, normalizasyon) olarak adım prepocessing ortak olan özellik Ölçekleme - Wikipedia - Bu soru yakın Soru # 41704 - Nasıl ve neden normalleştirme ve özellik ölçeklendirme çalışır? Karar Ağaçları ile ilgili iki sorum var: Özellik ölçeklendirmesi gerektiren herhangi bir karar ağacı uygulaması …

1
Anova () ve drop1 () neden GLMM'ler için farklı cevaplar verdi?
Formun bir GLMM var: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kullandığımda , araç paketinden veya drop1(model, test="Chi")kullandığımdan farklı sonuçlar alıyorum . Bu son ikisi aynı cevapları verir.Anova(model, type="III")summary(model) Bir grup uydurma veri kullanarak, bu iki yöntemin normalde farklı olmadığını gördüm. Dengeli doğrusal …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
Gradyan ağacının güçlendirilmesinde ağaç boyutu
Friedman tarafından önerildiği gibi gradyan ağacı güçlendirmesi J, temel öğrenciler olarak terminal düğümleri (= yapraklar) olan karar ağaçlarını kullanır . Tam olarak Jdüğümleri olan bir ağacı büyütmenin birkaç yolu vardır, örneğin bir ağacı ilk derinlikte veya genişlikte ilk şekilde büyütebilir, ... JDegrade ağacı güçlendirmek için tam olarak terminal düğümleri ile …
10 r  cart  boosting 

1
R doğrusal regresyon kategorik değişkeni “gizli” değer
Bu sadece birkaç kez karşılaştığım bir örnektir, bu yüzden örnek verilerim yok. R'de doğrusal regresyon modeli çalıştırmak: a.lm = lm(Y ~ x1 + x2) x1sürekli bir değişkendir. x2kategoriktir ve üç değeri vardır, örneğin "Düşük", "Orta" ve "Yüksek". Bununla birlikte, R tarafından verilen çıktı aşağıdaki gibi olacaktır: summary(a.lm) Estimate Std. Error …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

2
Popülasyonlar arasındaki farklılıkları inceleme
Diyelim ki iki popülasyondan bir örnek aldık: Ave B. Bu popülasyonların bireylerden oluştuğunu varsayalım ve bireyleri özellikler açısından tanımlamayı seçiyoruz. Bu özelliklerin bazıları kategoriktir (örn. İşe giderler mi?) Ve bazıları sayısaldır (örn. Boyları). Şu özellikleri çağıralım: . Bu özelliklerden yüzlerce (örneğin n = 200) toplarız, basitlik olduğunu varsayalım, tüm bireylerde …

2
Ağaç tahmin edicileri HER ZAMAN yanlı mıdır?
Karar Ağaçları hakkında bir ödev yapıyorum ve cevaplamam gereken sorulardan biri "Ağaçlardan yapılan tahmin ediciler neden önyargılı ve torbalama varyanslarını azaltmaya nasıl yardımcı oluyor?" Şimdi, aşırı takılmış modellerin gerçekten düşük önyargıya sahip olduklarını biliyorum, çünkü tüm veri noktalarına uymaya çalışıyorlar. Ve, Python'da bazı veri kümesine bir ağaç yerleştiren bir senaryom …
9 cart  bias 

2
CART ağaçları tahmin ediciler arasındaki etkileşimleri yakalar mı?
Bu makale , CART'ta, her adımda tek bir ortak değişken üzerinde ikili bir bölünme gerçekleştirildiğinden, tüm bölünmelerin dik olduğunu ve bu nedenle ortak değişkenler arasındaki etkileşimlerin dikkate alınmadığını iddia etmektedir. Bununla birlikte, birçok ciddi referans, aksine, bir ağacın hiyerarşik yapısının, öngörücüler arasındaki etkileşimlerin otomatik olarak modellenmesini (örneğin, bu makale ve …

2
Sağkalım fonksiyonlarına uyum iyiliği nasıl değerlendirilir
Sınıflandırma ve regresyon konusunda biraz bilgim olmasına rağmen, hayatta kalma analizine yeni başladım. Regresyon için MSE ve R kare istatistiklerine sahibiz. Fakat hayatta kalma model A'nın bazı grafiksel grafiklerin (KM eğrisi) yanı sıra hayatta kalma modeli B'den daha üstün olduğunu nasıl söyleyebiliriz? Mümkünse, lütfen farkı bir örnekle açıklayın (örneğin, R'deki …

1
Rpart () içindeki bölünme sayısı nasıl seçilir?
Ben kullandım rpart.controliçin minsplit=2ve aşağıdaki sonuçlar aldık rpart()fonksiyonu. Verilerin fazla sığmasını önlemek için bölme 3 veya bölme 7 kullanmam gerekir mi? Bölmeleri 7 kullanmamalı mıyım? Lütfen bana haber ver. Ağaç yapımında kullanılan değişkenler: [1] ct_a ct_b usr_a Root node error: 23205/60 = 386.75 n= 60 CP nsplit rel error xerror …
9 r  cart  rpart 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.