«random-forest» etiketlenmiş sorular

Rastgele orman, birçok karar ağacının çıktılarını birleştirmeye dayanan bir makine öğrenme yöntemidir.

1
Rastgele orman ve tahmin
Random Forest'ın nasıl çalıştığını anlamaya çalışıyorum. Ağaçların nasıl yapıldığına dair bir kavrayışım var ama Rastgele Orman'ın torba örneği üzerinde nasıl tahmin yaptığını anlayamıyorum. Biri bana basit bir açıklama yapabilir mi lütfen? :)


5
Rasgele Orman ve Karar Ağacı Algoritması
Rastgele bir orman, torbalama kavramını takip eden karar ağaçlarının bir koleksiyonudur. Bir karar ağacından bir sonraki karar ağacına geçtiğimizde, son karar ağacı tarafından öğrenilen bilgiler bir sonrakine nasıl ilerler? Çünkü, anlayışım gereği, her karar ağacı için oluşturulan ve bir sonraki karar ağacı yanlış sınıflandırılmış hatadan öğrenmeye başlamadan önce yüklenen eğitimli …

1
Rastgele Orman'da neden özelliklerin rastgele bir alt kümesi, ağaç düzeyinde değil düğüm düzeyinde seçiliyor?
Benim sorum: Rasgele orman, neden ağaç düzeyinde değil de her ağaçtaki düğüm düzeyinde bölünmeye yönelik özelliklerin rastgele alt kümelerini ele alıyor ? Arka plan: Bu bir tarih sorusu. Tin Kam Ho , 1998'de her ağacın büyümesi için kullanılacak bir özellik alt kümesini rastgele seçerek "karar ormanları" oluşturma üzerine bu makaleyi …


4
Doğrusal olmayan modeller kullanılırken çoklu-eş-doğrusallıktan endişe edilmeli mi?
Diyelim ki çoğunlukla kategorik özelliklere sahip bir ikili sınıflandırma problemimiz var. Öğrenmek için bazı doğrusal olmayan modeller (örneğin, XGBoost veya Rastgele Ormanlar) kullanıyoruz. Kişi hala çok eşbiçimli olma konusunda endişelenmeli mi? Neden? Yukarıdakilerin cevabı doğruysa, bu tip doğrusal olmayan modelleri kullandığını düşünerek nasıl mücadele etmeliyiz?

1
Random Forest: OOB vs CV'yi değerlendirin
Rastgele Bir Orman'ın kalitesini, örneğin AUC kullanarak değerlendirdiğimizde, bu miktarları Torba Dışı Örnekler üzerinden veya bekletme çapraz doğrulama seti üzerinden hesaplamak daha uygun mudur? OOB Örnekleri üzerinden hesaplamanın daha kötümser bir değerlendirme verdiğini duydum, ama nedenini göremiyorum.

3
Rasgele Orman ve Yükseltme parametrik mi yoksa parametrik değil mi?
Mükemmel İstatistiksel modellemeyi okuyarak : İki kültür (Breiman 2001) , geleneksel istatistiksel modeller (örneğin, doğrusal regresyon) ve makine öğrenme algoritmaları (örneğin, Torbalama, Rastgele Orman, Artırılmış ağaçlar ...) arasındaki tüm farkı ele geçirebiliriz. Breiman, veri modellerini (parametrik) eleştirir, çünkü gözlemlerin, İstatistikçi tarafından reçete edilen, Doğayı zayıf bir şekilde taklit edebilecek bilinen, …

3
Çok seviyeli / hiyerarşik olarak yapılandırılmış veriler üzerinde rastgele orman
Makine öğrenimi, CART teknikleri ve benzerleri için oldukça yeniyim ve umarım saflığım çok açık değildir. Rastgele Orman çok düzeyli / hiyerarşik veri yapılarını nasıl işler (örneğin, çapraz düzey etkileşimi söz konusu olduğunda)? Yani, çeşitli hiyerarşik düzeylerde analiz birimleri içeren veri kümeleri ( ör. Okullar içinde yuvalanmış öğrenciler, hem öğrenciler hem …

2
Rastgele Orman Modelleri kullanılırken Değişkenleriniz Ne Zaman Günlüğe Kaydedilir / Artırılır?
Çeşitli özelliklere dayalı fiyatları tahmin etmek için Random Forests kullanarak regresyon yapıyorum. Kod Python'da Scikit-learn kullanılarak yazılır. Regresyon modeline uyması için değişkenleri kullanmadan önce exp/ kullanmadan dönüştürüp dönüştürmemeye nasıl karar verirsiniz log? Rastgele Orman gibi bir Topluluk yaklaşımı kullanırken gerekli mi?

6
Rasgele orman: Test setinde yeni faktör seviyeleri nasıl ele alınır?
R'de rastgele bir orman modeli kullanarak tahminler yapmaya çalışıyorum. Ancak bazı faktörlerin test setinde eğitim setinden farklı değerlere sahip olduğundan hata alıyorum. Örneğin, bir faktörün test setinde egzersiz setinde görünmeyen Cat_2değerler 34, 68, 76vb. Vardır. Ne yazık ki, Test seti üzerinde kontrolüm yok ... Onu olduğu gibi kullanmalıyım. Benim tek …





Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.