«random-forest» etiketlenmiş sorular

Rastgele orman, birçok karar ağacının çıktılarını birleştirmeye dayanan bir makine öğrenme yöntemidir.

4
Çok seyrek verilerle iyi çalışan bir Rastgele Orman uygulaması var mı?
Çok seyrek verilerle iyi çalışan bir R rasgele orman uygulaması var mı? Binlerce veya milyonlarca boole girdi değişkenine sahibim, ancak verilen herhangi bir örnek için yalnızca yüzlerce kadar TRUE olacaktır. R'ye nispeten yeniyim ve seyrek verilerle ilgilenmek için bir 'Matrix' paketi olduğunu fark ettim, ancak standart 'randomForest' paketi bu veri …

2
Çok değişkenli regresyon için rastgele ormanlar
giriş özellikleri ve d y çıkışları ile çoklu çıkış regresyon problemim var . Çıktılar karmaşık, doğrusal olmayan bir korelasyon yapısına sahiptir.dxdxd_xdydyd_y Regresyonu yapmak için rastgele ormanları kullanmak istiyorum. Söyleyebileceğim kadarıyla, regresyon için rastgele ormanlar yalnızca tek bir çıktıyla çalışıyor, bu yüzden rastgele ormanlar - Her çıkış için bir tane. Bu …


5
R's randomForest 32'den fazla seviyeyi kaldıramaz. Geçici çözüm nedir?
R'nin randomForest paketi, 32'den fazla seviye ile faktörü kaldıramaz. 32'den fazla seviye verildiğinde bir hata mesajı verir: 32'den fazla kategoriye sahip kategorik öngörücüleri işleyemez. Ancak sahip olduğum verilerin birkaç faktörü var. Bazılarında 1000+, bazılarında 100+ var. Hatta 52 olan birleşik devletlerin “devletine” sahiptir. İşte benim sorum. Neden böyle bir sınırlama …

3
Kısmi bağımlılık parsellerinin y eksenini yorumlayabilme
Bu soru edildi göç o Çapraz doğrulanmış üzerinde yanıtlanabilir çünkü yığın taşması gelen. 5 yıl önce göç etti . Kısmi bağımlılık parselleri hakkındaki diğer konuları okudum ve bunların çoğu, onları nasıl doğru bir şekilde yorumlayabileceğinizi değil, onları farklı paketlerle nasıl çizdiğinizle ilgili. Adil miktarda kısmi bağımlılık grafiği okuyordum ve yaratıyorum. …

4
“Yarı denetimli öğrenme” - bu çok mu fazla?
Bir Kaggle yarışmasının ( Malware Classification ) kazanan çözümünün raporunu okuyordum . Rapor bu forum gönderisinde bulunabilir . Sorun, tren setinde 10000 element, test setinde 10000 element olan bir sınıflandırma problemiydi (dokuz sınıf, metrik logaritmik kayıptı). Yarışma sırasında, modeller test setinin% 30'una karşı değerlendirildi. Bir diğer önemli unsur, modellerin çok …

5
Rastgele orman vs regresyon
5 bağımsız değişken içeren veri setinde bir OLS regresyon modeli kullandım. Bağımsız değişkenler ve bağımlı değişken hem süreklidir hem de doğrusal olarak ilişkilidir. R Meydanı yaklaşık% 99,3'dür. Fakat aynı şeyi R'de rastgele orman kullanarak çalıştırdığımda sonucum '% Var açıklanan: 88.42'. Rastgele orman sonucu neden regresyondan daha düşük olur? Benim varsayım, …

5
Rastgele Ormanlarda yanlış sınıflandırma maliyeti nasıl kontrol edilir?
RandomForest R paketindeki yanlış sınıflandırma maliyetini kontrol etmek mümkün müdür ? Kendi işimde yanlış negatifler (örneğin, bir insanın bir hastalığa sahip olabileceği gibi yanlış) eksik, yanlış pozitiflerden çok daha maliyetlidir. Rpart paketi , kullanıcının farklı sınıflandırma ağırlıklarına göre farklılıklar için bir kayıp matrisi belirleyerek yanlış sınıflandırma maliyetlerini kontrol etmesine izin …

1
Sınıflandırmada eğitim verilerinin üretilmesi için tabakalı ve rastgele örneklemenin faydaları
Orijinal veri kümesini sınıflandırma için eğitim ve test setine bölerken rastgele örnekleme yerine tabakalı örnekleme kullanmanın herhangi bir / bazı avantajları olup olmadığını bilmek istiyorum. Ayrıca, tabakalı örnekleme sınıflandırıcıya rastgele örneklemeden daha fazla yanlılık getirir mi? Veri hazırlama için tabakalı örnekleme kullanmak istediğim uygulama, orijinal veri kümesinin üzerinde eğitilmiş bir …


3
Makine öğrenimi modellerini birleştirme
Ben veri madenciliği / makine öğrenimi / vb. ve tahminleri iyileştirmek için aynı modelin birden fazla modelini ve çalışmasını birleştirmenin birkaç yolunu okuyor. Birkaç makaleyi okuduğum izlenimim (teori ve yunan harfleri üzerinde genellikle ilginç ve harika, ancak kod ve gerçek örnekler üzerinde kısa) şu şekilde olması gerekiyor: Bir model ( …


2
Rastgele orman aşırı uyuyor mu?
Scikit-learn ile rastgele ormanları deniyorum ve eğitim setimin harika sonuçlarını alıyorum, ancak test setimde nispeten zayıf sonuçlar elde ediyorum ... İşte çözmeye çalıştığım problem (pokerden esinlenerek): Oyuncu A'nın delik kartları, oyuncu B'nin delik kartları ve bir flop (3 kart) verildi, hangi oyuncu en iyi ele sahip? Matematiksel olarak, bu 14 …

11
Lojistik regresyona neden bir makine öğrenme algoritması denir?
Doğru bir şekilde anladıysam, bir makine öğrenme algoritmasında, model deneyimlerinden öğrenmelidir, yani model yeni vakalar için yanlış tahmin verdiğinde, yeni gözlemlere adapte olmalı ve zamanla model giderek daha iyi hale geliyor . Lojistik regresyonun bu özelliği olduğunu görmüyorum. Peki neden hala bir makine öğrenme algoritması olarak kabul ediliyor? “Öğrenme” anlamında …

3
Regresyon için rastgele orman 'gerçek' bir regresyon mu?
Regresyon için rastgele ormanlar kullanılır. Ancak, anladığım kadarıyla, her bir yaprağa ortalama bir hedef değer atarlar. Her ağaçta sadece sınırlı yapraklar bulunduğundan, hedefin regresyon modelimizden elde edebileceği sadece belirli değerler vardır. Yani bu sadece 'ayrık' bir regresyon değil (bir adım fonksiyonu gibi) ve 'sürekli' olan lineer regresyon gibi değil midir? …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.