«decision-trees» etiketlenmiş sorular

Karar ağacı, ağaç benzeri bir grafik veya karar modeli ve bunların olası sonuçlarını (şans olayları, kaynak maliyetleri ve fayda dahil) kullanan bir karar destek aracıdır. Bir algoritmayı görüntülemenin bir yoludur.


6
karar ağacı / rastgele ormandaki özellikler olarak karakter dizileri
Karar ağacı / rastgele orman uygulamasında bazı problemler yaşıyorum. Sayı gibi karakter dizileri (ülke adı gibi) özellikli bir soruna uymaya çalışıyorum. Şimdi, kütüphane, scikit-learn sadece sayı olarak parametre alır, fakat önemli miktarda bilgi taşıdıkları gibi dizeleri de enjekte etmek istiyorum. Böyle bir senaryoyu nasıl idare ederim? Python'da karma gibi bazı …

3
Neden XGBoost ve Random Forest'a ihtiyacımız var?
Birkaç kavram konusunda net değildim: XGBoost, zayıf öğrencileri güçlü öğrencilere dönüştürür. Bunu yapmanın avantajı nedir? Tek bir ağacı kullanmak yerine birçok zayıf öğrenciyi birleştirmek mi? Rastgele Orman bir ağaç oluşturmak için ağaçtan çeşitli örnekler kullanır. Sadece tekil bir ağaç kullanmak yerine bu yöntemin avantajı nedir?

5
Karar ağacı algoritmaları doğrusal mı yoksa doğrusal değil mi?
Son zamanlarda bir arkadaşımdan bir röportajda karar ağacı algoritmalarının doğrusal mı yoksa doğrusal olmayan algoritma mı olduğu soruldu. Bu sorunun cevabını aramaya çalıştım ama tatmin edici bir açıklama bulamadım. Herkes bu sorunun çözümünü cevaplayabilir ve açıklayabilir mi? Ayrıca, doğrusal olmayan makine öğrenme algoritmalarına başka örnekler nelerdir?

5
deniz dibi ısı haritasını büyüt
corr()Orijinal bir df dışında bir df oluşturun . corr()Df 70 X 70 çıktı ve ısı haritası görselleştirmek mümkün değildir ... sns.heatmap(df). Göstermeye çalışırsam corr = df.corr(), tablo ekrana sığmaz ve tüm korelasyonları görebilirim. Boyutundan dfbağımsız olarak tümünü yazdırmanın veya ısı haritasının boyutunu kontrol etmenin bir yolu var mı ?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

3
Xgboost'taki olasılıklar nasıl tahmin edilir?
Aşağıdaki tahmin fonksiyonu -ve değerleri de vermektedir, bu yüzden olasılık olamaz. param <- list(max.depth = 5, eta = 0.01, objective="binary:logistic",subsample=0.9) bst <- xgboost(param, data = x_mat, label = y_mat,nround = 3000) pred_s <- predict(bst, x_mat_s2) Google & denedim pred_s <- predict(bst, x_mat_s2,type="response") ama işe yaramadı. Soru Bunun yerine olasılıklar nasıl …



4
Karar ağacı mı yoksa lojistik regresyon mu?
Bir sınıflandırma problemi üzerinde çalışıyorum. Eşit sayıda kategorik değişken ve sürekli değişken içeren bir veri setim var. Hangi tekniği kullanacağımı nasıl bileceğim? karar ağacı ile lojistik regresyon arasındaki ilişki nedir? Lojistik regresyonun sürekli değişken için daha uygun olacağını ve karar ağacının sürekli + kategorik değişken için daha uygun olacağını varsaymak …

1
Gradyan yükseltilmiş ağaçlar herhangi bir fonksiyona uyabilir mi?
Sinir ağları için elimizdeki evrensel yaklaşım teoremi sinir ağları bir kompakt alt kümesi üzerinde herhangi sürekli fonksiyonunu tahmin bildiren .R,nRnR^n Gradyan ile güçlendirilmiş ağaçlar için benzer bir sonuç var mı? Daha fazla şube eklemeye devam edebileceğiniz için makul görünüyor, ancak konuyla ilgili resmi bir tartışma bulamıyorum. EDIT: Sorum çok regresyon …

1
Karar ağaçları: yaprak bilge (en iyisi ilk) ve seviye bilge ağacı geçişi
Sorun 1: Ağacın genişleme şekliyle ilgili LightGBM tanımıyla kafam karıştı . Belirtiyorlar: Karar ağacı öğrenme algoritmalarının çoğu, aşağıdaki görüntüde olduğu gibi, seviye (derinlik) yönde büyür: Sorular 1 : Hangi "en" algoritmalar bu şekilde uygulanır? Bildiğim kadarıyla C4.5 ve CART DFS kullanıyor. XGBoost BFS kullanır. Hangi diğer algoritmalar veya paketler karar …

1
XGBRegressor vs.Xgboost.Güzel hız farkı mı?
Modelimi aşağıdaki kodu kullanarak eğitirsem: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) yaklaşık 1 dakika içinde biter. Modelimi Sci-Kit öğrenme yöntemini kullanarak eğitirsem: import xgboost as xg max_depth …



2
Sinir Ağı ve Karar Ormanı verileri nasıl normalleştirilir?
20000 örnekli bir veri setim var, her biri 12 farklı özelliğe sahip. Her örnek ya 0 ya da 1 kategorisindedir. Sonuçları ve her iki tekniği karşılaştırabilmem için örnekleri bir sinir ağı ve bir karar ormanı eğitmek istiyorum. Tökezlediğim ilk şey verilerin düzgün şekilde normalleştirilmesidir. Bir özellik kapsama alanında[0,106][0,106][0,10^6], başka biri …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.