Sayısal verileri rastgele ormanla tahmin etme


12

Rastgele Bir Orman, sayım verilerini uygun şekilde tahmin etmek üzere eğitilebilir mi? Bu nasıl olacaktı? Oldukça geniş bir değer yelpazem var, bu yüzden sınıflandırma gerçekten mantıklı değil. Eğer regresyon kullanırsam sonuçları kısaltır mıydım? Burada oldukça kayboldum. Herhangi bir fikir?


1
poisson regresyonunu kullanamaz mısın?
RJ-

Parametrik olmayan bir şey kullanmak istedim. Poisson regresyon varsayımlarını gerçekten hatırlamıyorum, ancak bunlardan birinin gözlemlerin bağımsız olduğundan ve burada derinden yerine getirilmediğinden eminim. Bu beni çok etkileyebilir mi?
JEquihua

2
Sadece RF regresyonu yapmayı denediniz mi? Sadece yeterince iyi çalışabilir.

1
Olmaz. Ama bu benim ilk içgüdümdü. Log veya karekök dönüşümü. Ama bu konuda herhangi bir deneyim olup olmadığını görmek istedim.
JEquihua

Sadece tepki, günlük (yanıt) ve sqrt (yanıt) üzerinde regresyon yapmayı denedim ve iyi bir şey aldım. Bence sorun, bağımsız değişkenlerimin daha çok yanıtı açıklamasıdır. Oh iyi.
JEquihua

Yanıtlar:


8

mobForestSayılan veriler için gerçek bir rastgele ormana uyacak denilen bir R paketi var . Bu dayanmaktadır mod()içinde (model-bazlı yinelemeli bölümleme) partypaket. familyArgüman olarak belirtilirse Poisson regresyonunu gerçekleştirir poisson(). Paket artık CRAN deposunda değil, ancak daha önce mevcut olan sürümler arşivden alınabiliyor.

Rastgele orman / torbalama ile sınırlı değilseniz, sayım verileri için bir yükseltme sürümü de mevcuttur. Yani, gbm(genelleştirilmiş artırılmış regresyon modelleri). Ayrıca bir Poisson modeline de uyabilir.


5

Birkaç olasılık görüyorum.

  • Yanıtı birkaç rastgele kategoriye ayırabilir ve bir sınıflandırma ağacı kullanabilirsiniz
  • Sayımlar genellikle çok düşükse, 0, 0, 0, 1, 0, 3, 0, 2, her tamsayı sayısına sınıf olarak davranabilir ve yine bir sınıflandırma ağacı kullanabilirsiniz (muhtemelen sizin durumunuz değil). Bu durumlarda, sürekli regresyonun aksine, yüksek değişkenlikle açıklanmış bir tip metriği elde etmek daha zor olacaktır.
  • Sayımlar genellikle düşük değilse ve çok fazla varyasyon varsa, sadece bir regresyon ağacı ile giderdim. Örneğin, doğrusal regresyon üzerinde poisson regresyonunun kullanılması, sadece iyi bir lineer prediktör elde edilmesi söz konusu olduğunda sostur. Rastgele ormanla iyi bir tahmin gücü görmüyorsanız, özellikle sayım verilerini barındıran meraklı bir modelin sizin için çok şey yapacağından şüpheliyim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.