Rastgele efektleri (veya tekrarlanan ölçümleri) randomForest'e nasıl ekleyebilirim?


22

Sorunun çok anlamlı olacağından bile emin değilim, ancak rastgele ormanı rastgele etkile önerdikleri bir kaç başlık kağıdı gördüm. Bu R'de mümkün mü?


1
Evet, pek anlamlı değil. Rasgele etkilerle ne demek istiyorsun?
Simone

(1 | effect) olarak rastgele bir efekt ekleyebileceğiniz lmer işleviyle yapabileceklerinize benzer bir şey düşünüyorum.
mguzmann


2
Adreslere baktığınız yöntemlerin ne tür bir rastlantısallık olduğundan emin değilim. Rastgele ormanlar, ağacın dekorla ilişkilendirilmesiyle torbalama üzerinde basit bir gelişmedir. 'Rastgele' olarak adlandırılmasının nedeni, herhangi bir durumda, bir ağaçta bir bölünme olduğu düşünüldüğünde, bölünmüş adayın, p p belirleyicilerinin rastgele bir alt kümesinden seçilmesidir. Genellikle, m ~ sqrt (p). Ve her bölünme gerçekleştiğinde, rasgele bir belirteç alt kümesi seçilir, dolayısıyla rastgele orman.
psteelk

Yanıtlar:


13

Yaygın olarak birlikte kullanılmazlar ve birleştirmeden önce özen gösterilmelidir.

Rastgele ormanlar genellikle sınıflandırıcılar olarak kullanılır. Başka bir yöntem yerine rastgele bir orman kullanmanızın nedeni (örn. K-aracı kümeleme), sınıflandırmak istediğiniz çok sayıda boyuta sahip olmanız olabilir. Çok sayıda boyuta sahip olmakla ilgili sorun, tüm boyut siparişlerinin tüm kombinasyonlarını test etmek isterseniz, çok sayıda seçeneğiniz olacaktı (boyut faktörü sayısından daha hızlı büyür).

Rastgele etkiler genellikle aynı şeyin tekrarlanan ölçümleriyle regresyonda kullanılır. Genellikle karma terimin hem sabit hem de rastgele etkilere değindiği karma etkiler modellerinde kullanılır. Sabit etkilerin tekrar göreceğiniz parametreleri temsil ettiği düşünülmektedir (örneğin bir ilaç veya bir kişinin yaşı). Rastgele etkilerin, bir daha görmeyeceğiniz bir parametre etrafındaki değişkenliğin bir örneğini temsil ettiği düşünülmektedir (örneğin, belirli bir kişi).

Kümelenmiş veriler olduğunda bunları birlikte kullanma örnekleri vardır: http://dx.doi.org/10.1080/00949655.2012.741599 ve http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf .

Bu analizi yapabilen herhangi bir R paketinden habersizim.


2
Ek olarak, bu çalışmanın yazarları, uygulamalarının R kodunu sizinle paylaşmaktan mutluluk duyar. Sadece onlara e-posta gönder. Ben de öyle yaptım.
Brash Dengesi

Birkaç gün içinde bana e-posta gönderen Hajjam ile iletişim kuran Larocque ile iletişime geçtim.
Brash Dengesi

2
Adil uyarı olsa da, mevcut R kodu sadece sürekli veri için rastgele orman uygular. Kategorik verilerle başa çıkmak için genişletmeniz gerekir.
Brash Dengesi

10

Evet mümkün. " RE-EM Ağaçları: Boyuna ve Kümelenmiş Veriler için Bir Veri Madenciliği Yaklaşımı " nı ve ilgili R paketini REEMtree'yi kontrol etmelisiniz .

Gazeteye baktığımdan beri bir süre geçti. Yazarların henüz bu ağaçların topluluklarını oluşturmaya çalışmadıklarını, ancak hiçbir şeyin işe yaramayacağını önermediğini hatırlıyorum.


1
REEMtree, rastgele ormanlara uygulanan rastgele etkiler değildir. Rastgele orman modeline neyin girdiğinin bir parçası olan özyinelemeli bölümlemeye uygulanır. Bu yüzden bu cevabın Bill Denney'den daha yüksek bir puan almayı hak ettiğini sanmıyorum. Maalesef, bu konudaki en son oyum kilitlendi.
Brash Dengesi

1
Hadi, bir kere ağacı eline geçirdiğinde ormanı inşa etmek ne kadar zor? Rica ederim.
Ben Ogorek

1
Peki, rastgele ormanın önyükleme örneklemesine nasıl eklendiğini görünce, denemek için rastgele seçilen özelliklerin sayısının ayarlanması, ağaç sonuçlarının toplanması, vb. REEMtree’yi güçlendiren orman, Bill’in makalesini okumak ve yazarlardan R kodunu istemek kadar iyi bir çözüm değildir.
Brash Dengesi

8

Karışık Etkiler Rastgele Ormanlar (MERF'ler) bir şeydir. Yukarıdaki cevabın belirttiği gibi, Dr. Larocque'nin HEC Montreal'deki grubu tarafından onlar hakkında bazı büyük araştırmalar var. Makale burada: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .

Temel olarak, rastgele ormanların doğrusal olmayan modellemesini doğrusal rastgele etkiler ile birleştirmenin teorik olarak sağlam bir yoludur.

Python'da açık kaynaklı bir paket yayınladık , yukarıda algoritmayı kullanarak MERF uygulayan .

Paket ve kümelenmiş veri kümeleri için nasıl kullanılacağı hakkında ayrıntılı bir blog yazısı yazdık .


1
Bunu R'ye uygulamak veya kısmi bağımlılık arsa işlevselliği eklemek için herhangi bir düşünce
OliverFishCode
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.