Hangi uygulamalarda karar ağacı değişkeni (özellik) ölçeklemesi ve değişken (özellik) normalizasyonu (ayarlama) gerekir?


10

Birçok makine öğrenme algoritmaları, özellik ölçekleme (aka değişken ölçekleme, normalizasyon) olarak adım prepocessing ortak olan özellik Ölçekleme - Wikipedia - Bu soru yakın Soru # 41704 - Nasıl ve neden normalleştirme ve özellik ölçeklendirme çalışır?

Karar Ağaçları ile ilgili iki sorum var:

  1. Özellik ölçeklendirmesi gerektiren herhangi bir karar ağacı uygulaması var mı? Çoğu algoritmanın bölme ölçütlerinin ölçeğe kayıtsız olduğu izlenimindeyim.
  2. Şu değişkenleri göz önünde bulundurun: (1) Birimler, (2) Saat, (3) Saat başına birimler - bu üç değişkeni bir karar ağacına beslendiğinde "olduğu gibi" bırakmak mı yoksa bir tür çatışmaya girmek mi "normalize edilmiş" değişken (3) (1) ve (2) ile ilişkilendirilebilir mi? Yani, bu üç değişkeni de karışıma atarak bu duruma saldırır mıydınız yoksa tipik olarak üçünün bir kombinasyonunu seçer misiniz veya sadece "normalleştirilmiş / standartlaştırılmış" özelliğini kullanır mısınız (3)?

Yanıtlar:


6

1 için, genel olarak karar ağaçları genellikle ölçeklendirme gerektirmez. Bununla birlikte, veri görselleştirme / manipülasyona yardımcı olur ve performansı diğer verilerle veya SVM gibi diğer yöntemlerle karşılaştırmak istiyorsanız yararlı olabilir.

2 için, bu bir ayarlama sorusudur. Birimler / saat bir tür değişken etkileşim olarak kabul edilebilir ve tahmin gücü her birinden farklı olabilir. Bu gerçekten verilerinize bağlıdır. Bir fark olup olmadığını görmek için ve olmadan denemek istiyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.