Kısa versiyon: Karar ağacı oluşturabilen bir R paketi arıyorum, oysa karar ağacındaki her yaprak tam bir Doğrusal Regresyon modeli. AFAIK, kütüphane rpart
bağımlı değişkenin her yaprakta sabit olduğu karar ağaçları oluşturur. Bu rpart
ağaçları inşa edebilecek başka bir kütüphane (veya farkında olmadığım bir ortam) var mı?
Uzun sürüm: Bir eğitim veri kümesine dayalı bir karar ağacı oluşturan bir algoritma arıyorum. Ağaçtaki her karar, bağımsız değişkenlerden birinin durumuna göre eğitim verilerini iki kısma ayırır. Ağacın kökü tam veri kümesini içerir ve veri kümesindeki her öğe tam olarak bir yaprak düğümünde bulunur.
Algoritma şöyle gider:
- Ağacın kök düğümü olan tam veri kümesiyle başlayın. Bu düğümü seçin ve .
- Verilere Doğrusal regresyon modeli oluşturma .
- Eğer arasında 'nın lineer model bir eşik değerinden daha yüksek olduğu , sonra yapılır konum , böylece işaretlemek adım 5, bir yaprağın ve atlama olarak. N θ R 2 N N
- Deneyin rasgele kararlar ve en iyi sonuçlar bir çekme subnodes içinde:
R ' 2
- Rastgele bağımsız bir değişken ve rastgele bir eşik .θ i
- kararı , veri kümesini ve üzere iki yeni düğüme böler . K K ~ K
- Hem hem de üzerinde Doğrusal Regresyon modelleri oluşturun ve hesaplayın (bunlara ve deyin ). ~ K R2 R ~ r
- Tüm bu kaynaktan dizilerini , maksimal ile birini seçmek . Bu, ağaçta yeni bir karar verir ve iki yeni alt düğümü vardır ve .( v ı , θ i , r , ~ r ) m ı n ( r , ~ r ) K K ~ K
- işlemeyi bitirdik . Henüz işlenmemiş yeni bir düğüm seçin ve 2. adıma geri dönün. Tüm düğümler işlenmişse, algoritma sona erer.N
Bu, verileri daha küçük parçalara ayıran ve bu parçaların her biri için bir Doğrusal Model hesaplayan bir özyinelemeli ağaç oluşturacaktır.
Adım 3, algoritmanın aşırı sığmasını önleyen çıkış koşuludur. Tabii ki, başka olası çıkış koşulları da var:
- Çıkış halinde ağacında sitesindeki derinliği üzerindeθ d e p t h
- Çıkış veri grubu ise küçükseθ d a t a s e t
R paketinde böyle bir algoritma var mı?