«cart» etiketlenmiş sorular

'Sınıflandırma ve Regresyon Ağaçları'. CART popüler bir makine öğrenim tekniğidir ve rastgele ormanlar ve eğim artırma makinelerinin ortak uygulamaları gibi tekniklerin temelini oluşturur.

9
Rastgele bir ormandan bilgi edinmek
Rastgele ormanlar kara kutu olarak kabul edilir, ancak son zamanlarda rastgele bir ormandan hangi bilgilerin elde edilebileceğini düşünüyordum? En belirgin şey değişkenlerin önemidir, en basit değişkende, sadece değişkenlerin oluşum sayısını hesaplayarak yapılabilir. Düşündüğüm ikinci şey etkileşimler. Ağaç sayısı yeterince büyükse, o zaman değişken çiftlerinin oluşum sayısının test edilebildiğini düşünüyorum (ki …

2
Gradyan Artırıcı Ağaç vs Rastgele Orman
Friedman'ın önerdiği şekilde yükselen gradyan ağacı karar ağaçları temel öğrenenler olarak kullanır. Temel karar ağacını olabildiğince karmaşık (tamamen büyümüş) veya daha mı basit hale getirmemiz gerektiğini merak ediyorum. Seçim için bir açıklama var mı? Rastgele Orman, karar ağacı olarak temel öğrenenler olarak kullanılan başka bir topluluk yöntemidir. Anlayışıma dayanarak, genellikle …

1
Koşullu çıkarım ağaçları vs geleneksel karar ağaçları
Herkes (koşullu çıkarım ağaçları arasındaki temel farklılıkları açıklayabilir ctreedan party(örneğin daha geleneksel karar ağacı algoritmaları ile karşılaştırıldığında R paketinde) rpartR)? CI ağaçlarını farklı kılan nedir? Güçlülükler ve zayıflıklar? Güncelleme: Horthorn ve arkadaşlarının Chi'nin yorumlarda bahsettiği makaleye baktım. Tamamen takip edemedim - herhangi biri değişkenlerin permütasyonlar kullanılarak nasıl seçildiğini açıklayabilir mi …

3
Bir örnek: ikili sonuç için glmnet kullanarak LASSO regresyonu
Ben kullanımı ile serpmek başlıyorum glmnetile LASSO Regresyon ilgi benim sonuç dikotom olduğunu. Aşağıda küçük bir sahte veri çerçevesi oluşturdum: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

2
Rastgele Ormanların ayarlanması ile ilgili pratik sorular
Sorularım Rastgele Ormanlarla ilgili. Bu güzel sınıflandırıcı kavramı bana açık, ama yine de birçok pratik kullanım sorusu var. Ne yazık ki, RF için pratik bir rehber bulamadım (Geoffrey Hinton tarafından "Kısıtlı Boltzman Makineleri İçin Pratik Bir Rehber" gibi bir şey aradım ama Geoffrey Hinton! Bir kişi pratikte RF'yi nasıl ayarlayabilir? …

3
Aslında bir örnek ağaç randomForest :: getTree () 'den nasıl çizilir? [kapalı]
Herkes, aşağıdakilerden birkaç örnek ağacı çizmenin kütüphane veya kod önerilerini aldı: getTree(rfobj, k, labelVar=TRUE) (Evet, bunu operasyonel bir şekilde yapmanız gerekmediğini biliyorum, RF bir kara kutu, vb. Vb. Görüyorum. Bir ağacın görsel olarak akıl sağlığı kontrolünü yapmak istiyorum - herhangi bir değişkenin ters davranıp davranmadığını görmek için bir ağacı kontrol …

3
Sapma nedir? (özellikle CART / rpart'ta)
“Sapma” nedir, nasıl hesaplanır ve istatistiki olarak farklı alanlarda kullanımları nelerdir? Özellikle, CART’daki kullanımlarıyla (ve R’de rpart’taki uygulaması) kişisel olarak ilgileniyorum. Bunu soruyorum çünkü wiki makalesi biraz eksik görünüyor ve görüşleriniz en iyi şekilde karşılanacak.
45 r  cart  rpart  deviance 

4
Dengesiz verilere karşı karar ağacı eğitimi
Veri madenciliğinde yeniyim ve dengesiz bir veri setine karşı bir karar ağacı yetiştirmeye çalışıyorum. Ancak, zayıf tahmin doğruluğu ile ilgili sorunlar yaşıyorum. Veriler ders okuyan öğrencilerden oluşur ve sınıf değişkeni iki değeri olan ders durumudur - Çekilmiş veya Akım. Yaş Etnik köken Cinsiyet Elbette ... Kurs Durumu Veri setinde, Akım …

3
Karar Ağaçları neden hesaplamalı olarak pahalı değil?
In R Uygulamaları ile İstatistiksel Öğrenme An Introduction , yazarlar uydurma olduğunu yazmak karar ağacını çok hızlıdır, ama bu benim için bir anlam ifade etmiyor. Algoritma, her bir özelliğin içinden geçmeli ve optimal bölünmeyi bulmak için mümkün olan her şekilde bölümlendirmelidir. gözlemli sayısal özellikler için bu, her özellik için bölümle …
38 cart 

6
Neden% 100 doğrulukta karar ağacı alıyorum?
Karar ağacım için% 100 doğruluk elde ediyorum. Neyi yanlış yapıyorum? Bu benim kodum: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import train_test_split x_train = x[0:2635] x_test = x[0:658] y_train …


1
Yükseltme için göreceli değişken önemi
Göreceli değişken öneminin aşırı genel / basit olmayan Gradient Boostted Trees içinde nasıl hesaplandığına dair bir açıklama arıyorum: Ölçümler, bir değişkenin bölünme için seçilme sayısına dayanır, her bölünmenin sonucu olarak karenin iyileştirilmesiyle ağırlıklandırılır ve tüm ağaçların ortalaması alınır . [ Elith ve diğ. 2008, Regresyon ağaçlarının güçlendirilmesi için bir çalışma …

3
Rastgele ormanlar aykırı değerlere nasıl duyarlı değildir?
Ben dahil olmak üzere birkaç kaynaklardan okudum bu bir Rastgele Ormanlar (örneğin, Lojistik Regresyon ve diğer ML yöntemlerdir bu şekilde) uçlara karşı duyarlıdır olmadığını. Ancak iki sezgi bana aksini söylüyor: Bir karar ağacı ne zaman yapılırsa, bütün puanların sınıflandırılması gerekir. Bu, aykırıların bile sınıflandırılacağı ve dolayısıyla yükseltme sırasında seçildikleri karar …

1
GBM parametreleri için bazı yararlı kurallar nelerdir?
GBM'yi kullanarak parametreleri test etmek için bazı yararlı kurallar (örneğin etkileşim derinliği, minchild, numune oranı, vb.) Nelerdir? Diyelim ki, 200.000 nüfuslu 70-100 özelliğe sahibim ve 3 ve 4'lük etkileşim derinliğini test etmeyi düşünüyorum. Açıkça, hangi parametrelerin kombinasyonunun en iyi örnek dışı kaldığını görmek için bazı testler yapmam gerekiyor. Bu test …

4
CART kullanırken “değişken önemi” nasıl ölçülür / derecelendirilir? (özellikle R'den {rpart} kullanarak)
Rpart (R) kullanarak bir CART modeli (özellikle sınıflandırma ağacı) oluştururken, modele tanıtılan çeşitli değişkenlerin önemini bilmek genellikle ilginçtir. Dolayısıyla benim sorum şu: Bir CART modelinde katılımcı değişkenlerin değişken önem derecesini sıralamak / ölçmek için hangi ortak önlemler var? Ve bu nasıl R kullanılarak hesaplanabilir (örneğin, rpart paketini kullanırken) Mesela, işte …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.