«random-forest» etiketlenmiş sorular

Rastgele orman, birçok karar ağacının çıktılarını birleştirmeye dayanan bir makine öğrenme yöntemidir.


2
Kukla değişkenlerle özellik önemi
Kukla değişkenlere ayrılmış kategorik bir değişkenin önemini nasıl elde edebileceğimi anlamaya çalışıyorum. Ben sizin için kategorik değişkenleri R veya h2o yaptığı gibi işlemez scikit-learn kullanıyorum. Kategorik bir değişkeni sahte değişkenlere ayırırsam, bu değişkente sınıf başına ayrı özellik içe aktarımları elde ederim. Benim sorum şu, bu kukla değişken ithalatlarını sadece toplayarak …

1
R kare değeri modelleri karşılaştırmak için uygun mu?
Otomobil seri ilan sitelerinde mevcut fiyatları ve özellikleri kullanarak, otomobil fiyatlarını tahmin etmek için en iyi modeli belirlemeye çalışıyorum. Bunun için scikit-öğrenim kütüphanesinden birkaç model ve pybrain ve neurolab'dan sinir ağı modelleri kullandım. Şu ana kadar kullanılan bir yaklaşım, bazı örneklerle veri sabit bir miktar (makine öğrenme algoritmaları) çalıştırmak ve …

3
SVM dışında hangi algoritmaların özellik ölçeklendirmesi gerekir?
Birçok algoritma ile çalışıyorum: RandomForest, DecisionTrees, NaiveBayes, SVM (çekirdek = doğrusal ve rbf), KNN, LDA ve XGBoost. SVM dışında hepsi oldukça hızlıydı. O zaman daha hızlı çalışmak için özellik ölçeklendirmesi gerektiğini bilmeliyim. Sonra aynı şeyi diğer algoritmalar için de yapmam gerekip gerekmediğini merak etmeye başladım.


2
Rastgele Ormanlarla özellik seçimi
Çoğunlukla yüksek derecede korelasyonlu ve çok gürültülü (örneğin teknik göstergeler) çoğunlukla finansal değişkenlere (120 özellik, 4k örnek) sahip bir veri setim var, bu yüzden model eğitimi (ikili sınıflandırma) ile daha sonra kullanmak üzere maksimum 20-30'u seçmek istiyorum - artış azalış). Özellik sıralaması için rastgele ormanlar kullanmayı düşünüyordum. Bunları tekrar tekrar …

5
R'deki Rastgele Ormanlarla sınıflandırma için dengesiz sınıf büyüklüklerine göre nasıl ayarlanmalıdır?
Üzerinde çalıştığım bir proje için farklı sınıflandırma yöntemleri araştırıyorum ve Rastgele Ormanları denemekle ilgileniyorum. Ben ilerlerken kendimi eğitmeye çalışıyorum ve CV topluluğu tarafından sağlanan yardımları takdir ediyorum. Verilerimi eğitim / test setlerine ayırdım. R'deki rastgele ormanlarla yapılan deneylerden (randomForest paketini kullanarak), daha küçük sınıfım için yüksek yanlış sınıflandırma oranı ile …


2
Birden fazla çıkışı olan bir Rastgele Orman mümkün / pratik olabilir mi?
Rastgele Ormanlar (RF) rekabetçi bir veri modelleme / madencilik yöntemidir. Bir RF modelinin bir çıkışı vardır - çıkış / tahmin değişkeni. RF'lerle çoklu çıkışların modellenmesine yönelik naif yaklaşım, her çıkış değişkeni için bir RF oluşturmak olacaktır. Bu yüzden N bağımsız modelimiz var ve çıktı değişkenleri arasında korelasyon olduğunda, yedekli / …

3
`Pred.randomForest` sınıf olasılıklarını nasıl tahmin ediyor?
Kullandığımda randomForestpaket sınıf olasılıklarını nasıl tahmin ediyor predict(model, data, type = "prob")? Ben kullanıyordum rangerkullanarak rastgele ormanlar yetiştirilmesi probability = Tolasılıklarını tahmin etmek argüman. rangerbelgelerde şöyle diyor: Malley ve ark. (2012). Bazı verileri simüle ettim ve her iki paketi de denedim ve çok farklı sonuçlar elde ettim (aşağıdaki koda bakın) …


4
Düşük sınıflandırma doğruluğu, sonra ne yapmalı?
Yani, ML alanında bir acemi oldum ve biraz sınıflandırma yapmaya çalışıyorum. Amacım bir spor etkinliğinin sonucunu tahmin etmektir. Bazı tarihsel veriler topladım ve şimdi bir sınıflandırıcı yetiştirmeye çalıştım. Yaklaşık 1200 örnek aldım, bunlardan 0.2 tanesi test amaçlı olarak ayırdım, diğerleri farklı sınıflandırıcılar ile ızgara aramasına (çapraz doğrulama dahil) koydum. Şu …

1
Ağırlıklı Rastgele Orman için R paketi? classwt seçeneği?
Son derece dengesiz bir veri kümesinin sonucunu tahmin etmek için Random Forest kullanmaya çalışıyorum (azınlık sınıf oranı sadece% 1 veya daha az). Geleneksel Rastgele Orman algoritması, azınlık sınıflarına özel önem vermek yerine genel hata oranını en aza indirdiğinden, dengesiz verilere doğrudan uygulanamaz. Bu yüzden azınlık sınıfının yanlış sınıflandırılmasına yüksek bir …
16 r  random-forest 

2
Rastgele Ormanlar için hangi eğitim hatası rapor edilir?
Şu anda randomForestR'de paketi kullanarak bir sınıflandırma sorunu için rastgele ormanlar uyuyorum ve bu modeller için eğitim hatasını nasıl bildireceğinden emin değilim . Komutla aldığım tahminleri kullanarak hesapladığımda eğitim hatam% 0'a yakın: predict(model, data=X_train) X_traineğitim verileri nerede . İlgili bir soruya yanıt olarak, rastgele ormanlar için eğitim hatası metriği olarak …

1
Bir lmer modeli için hangi çoklu karşılaştırma yöntemi kullanılır: lsmeans veya glht?
Bir veri setini bir sabit efekt (durum) ve iki rastgele efekt (katılımcı konu tasarımı ve çifti nedeniyle katılımcı) ile karışık efektler modeli kullanarak analiz ediyorum. Model ile oluşturulan lme4paket: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Sonra, bu modelin sabit etki (durum) olmadan modele karşı bir olasılık oranı testi yaptım ve önemli bir farkım var. Veri …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.