Karar ağaçlarındaki sürekli değişkenler için bir bölme noktası nasıl seçilir?


15

Karar ağaçları ile ilgili iki sorum var:

  1. Sürekli bir özelliğimiz varsa, bölme değerini nasıl seçeriz?

    Örnek: Yaş = (20,29,50,40 ....)

  2. R'de değerleri olan sürekli bir öznitelik sahip olduğumuzu düşünün . Bölünmüş noktası bulan bir algoritma yazabilirsiniz v biz bölmek zaman bu sırayla, f tarafından v , biz için minimum kazanç var f > v ?fRvfvf>v

Yanıtlar:


18

(20,29,40,50)(24.5,34.5,45)

Yalnızca farklı sınıfların örnekleri arasında yer alan bölünmüş noktaları kontrol ederek hesaplama zamanından tasarruf edebilirsiniz, çünkü yalnızca bu böler bilgi kazanımı için ideal olabilir.


@timleathart OP R "uygulama" kaşık beslenmiş "olmayı bekliyor. OP R uygulaması referans ile şimdiye kadar ne denedim acaba? "Biraz çaba göstermeye" ne dersin, OP?
mnm

@timleathart ama normalde bir özellik f için f> v için en büyük bilgi kazanımını sağlayan bölünmüş v'yi seçeriz, ama burada asgari kazanç için istedikleri soruya bakın.
WALID BELRHALMIA

@timleathart, daha fazla açıklayabilir misin? Bu tür bölünmeleri tanımlamanın ve bilgi kazanımını kontrol etmenin en iyi yolunu bilmem gerekiyor. Bir değişkenin çok fazla varyasyonu olduğunu ve diğerinin neredeyse sabit olduğunu varsayalım. Böyle kaç bölünme olmalı?
Arpit Sisodia

@timeleathart, ur cevabınızı genişleterek, değerler olduğunda bu bölünme optimize edilmeyecektir (20,21,22,23, 45,67,80). Burada maksimum kullanılabilir yineleme olmamalı? Varsayımım yanlışsa lütfen beni düzeltin :)
Arpit Sisodia

Bu benim karışıklıklarımı netleştirir!
Jinhua Wang
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.