«cart» etiketlenmiş sorular

'Sınıflandırma ve Regresyon Ağaçları'. CART popüler bir makine öğrenim tekniğidir ve rastgele ormanlar ve eğim artırma makinelerinin ortak uygulamaları gibi tekniklerin temelini oluşturur.

2
Karar ağacını kim icat etti?
Karar ağacı veri yapısını ve algoritmasını kimin icat ettiğini bulmaya çalışıyorum. Karar ağacı öğrenimine ilişkin Wikipedia girişinde "ID3 ve CART'ın aynı anda bağımsız olarak icat edildiği (1970 ile 1980 arasında)" iddiası var. ID3 daha sonra sunuldu: Quinlan, JR 1986. Karar Ağaçlarının İndüksiyonu. Mach. Öğrenin. 1, 1 (Mart 1986), 81-106 bu …
24 cart  history 

2
CHAID - CRT (veya CART)
Yaklaşık 20 tahminciye sahip bir veri setinde SPSS kullanarak bir karar ağacı sınıflandırması yapıyorum (birkaç kategoriyle kategorik). CHAID (Ki-kare Otomatik Etkileşim Algılama) ve CRT / CART (Sınıflandırma ve Regresyon Ağaçları) bana farklı ağaçlar veriyor. Herhangi biri CHAID'in CRT'ye olan göreceli değerini açıklayabilir mi? Bir yöntemi diğerine kullanmanın etkileri nelerdir?
23 spss  cart 

5
Sınıflandırma ağaçlarına alternatifler, daha iyi tahmine dayalı (örneğin: CV) performans?
Daha iyi tahmin gücü sağlayabilecek Sınıflandırma Ağaçlarına bir alternatif arıyorum. Ele aldığım verilerin hem açıklayıcı hem de açıklanmış değişkenler için faktörleri var. Bu bağlamda rastgele ormanlara ve sinir ağlarına rastladığımı hatırlıyorum, daha önce hiç denememiş olmama rağmen, böyle bir modelleme görevi için başka iyi bir aday var mı (açıkça R'de)?


2
GINI skoru ile log-olabilirlik oranı arasındaki ilişki nedir?
Sınıflandırma ve regresyon ağaçlarını inceliyorum ve ayrık konum için alınacak önlemlerden biri GINI puanı. Şimdi iki dağıtım arasında aynı verinin olabilirlik oranının günlüğü sıfır olduğunda en iyi bölünme konumunu belirlemeye alışkınım, yani üyelik olasılığının eşit olması muhtemel. Sezgim, GINI'nin matematiksel bir bilgi teorisinde iyi bir temele sahip olması gerektiğini (Shannon) …

4
Karar ağaçları neredeyse her zaman ikili ağaç mıdır?
Neredeyse karşılaştığım her karar ağacı örneği ikili bir ağaç oluyor. Bu oldukça evrensel mi? Standart algoritmaların çoğu (C4.5, CART, vb.) Yalnızca ikili ağaçları destekliyor mu? Topladığım kadarıyla, CHAID ikili ağaçlarla sınırlı değil, ama bu bir istisna gibi görünüyor. Çocuklardan birine iki yönlü bir bölünme izleyen iki yönlü bir bölünme, üç …

4
PCA alanına yeni bir vektör nasıl yansıtılır?
Temel bileşen analizi (PCA) yaptıktan sonra, PCA alanına yeni bir vektör yansıtmak istiyorum (yani PCA koordinat sistemindeki koordinatlarını bulmak). PCA'yı R dilinde kullanarak hesapladım prcomp. Şimdi vektörümü PCA dönme matrisi ile çarpabilmeliyim. Bu matristeki temel bileşenler satır veya sütunlar halinde mi düzenlenmelidir?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 



3
Karar kütüğü doğrusal bir model midir?
Karar kütüğü, sadece bir bölünmüş bir karar ağacıdır. Ayrıca parçalı bir işlev olarak da yazılabilir. Örneğin, bir vektör olduğunu ve ilk bileşeni olduğunu varsayalım , regresyon ayarında bazı kararlar olabilirxxxx1x1x_1xxx f(x)={35x1≤2x1>2f(x)={3x1≤25x1>2f(x)= \begin{cases} 3& x_1\leq 2 \\ 5 & x_1 > 2 \\ \end{cases} Ama doğrusal bir model mi? nerede olarak …

1
“Özellik alanı” nedir?
"Feature space "'nin tanımı nedir? Örneğin, SVM'leri okurken "özellik alanına eşleme" hakkında okudum. CART hakkında okurken, "özellik alanına bölümleme" hakkında okudum. Neler olduğunu anlıyorum, özellikle de CART için, ama kaçırdığım bir tanım olduğunu düşünüyorum. "Özellik alanı" nın genel bir tanımı var mı? SVM çekirdekleri ve / veya CART hakkında bana …

3
Regresyon için rastgele orman 'gerçek' bir regresyon mu?
Regresyon için rastgele ormanlar kullanılır. Ancak, anladığım kadarıyla, her bir yaprağa ortalama bir hedef değer atarlar. Her ağaçta sadece sınırlı yapraklar bulunduğundan, hedefin regresyon modelimizden elde edebileceği sadece belirli değerler vardır. Yani bu sadece 'ayrık' bir regresyon değil (bir adım fonksiyonu gibi) ve 'sürekli' olan lineer regresyon gibi değil midir? …

2
Derin öğrenme vs. Karar ağaçları ve güçlendirme yöntemleri
Ben (ampirik veya teorik olarak) karşılaştırmak ve tartışmak kağıtları veya metin arıyorum: Arttırılması ve karar ağaçları gibi algoritmalar Rasgele Orman veya AdaBoost ve GentleBoost karar ağaçlarına uygulanmıştır. ile Kısıtlı Boltzmann Makineleri , Hiyerarşik Geçici Bellek , Konvolüsyonel Sinir Ağları , vb. Gibi derin öğrenme yöntemleri . Daha spesifik olarak, bu …

1
Karar ağacının VC boyutu nedir?
İki boyutta bölünmüş karar ağacının VC boyutu nedir ? Diyelim ki model CART ve izin verilen bölünmeler sadece eksenlere paralel. Yani bir bölünme için bir üçgende 3 puan sipariş edebiliriz ve daha sonra noktaların herhangi bir etiketlenmesi için mükemmel bir tahmin alabiliriz (yani: parçalanmış noktalar) Peki ya 2 yarma ya …

1
Ağaçların Artırılması ve Torbalanması (XGBoost, LightGBM)
Ağaçları torbalama veya artırma fikirleri hakkında birçok blog yazısı, YouTube videosu vb. Var . Genel anlayışım, her biri için sözde kod: torbalama: Örneklerin% x'i ve özelliklerin% y'i N rasgele örneği alın Modelinizi (örn. Karar ağacı) N Her bir N ile tahmin edin Nihai tahmini almak için tahminleri ortalayın Arttırılması: Modelinizi …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.