randomForest sınıflandırma yerine regresyonu seçer

12

Ben randomForest paketi R ve iris verileri kullanarak, oluşturulan rastgele orman bir sınıflandırma olduğunu ama 700 özellikleri (özellikler 28x28 piksel görüntüde her piksel) özellikleri olan bir veri kümesi kullandığınızda ve etiket sütun adlı label, randomForestüretilen regresyon. Aşağıdaki satırı kullanıyorum:

rf <- randomForest(label ~ ., data=train)

Sınıflandırma yerine regresyon nasıl kullanılır? Veriler baştan sona okunur read.csv().

r random-forest

— Liseyi yarım bırakan
kaynak

10

randomForest, değişkenin sınıfına bağlı olarak varsayılan olarak sınıflandırma veya regresyon için kullanılır. Yani, yazarsanız

class(iris$Species)

bunun bir faktör olduğunu göreceksiniz. kodunuzdaki 'etiket' büyük olasılıkla sayısaldır, bu nedenle randomForest varsayılan olarak regresyona tabidir. Sınıflandırma için bir faktöre dönüştürmeniz gerekecektir. Read.table içinde colClasses ayarlayarak dönüştürebilir veya bir faktör olarak okuyabilirsiniz.

— julieth
kaynak

4

Çoğu zaman bunun nedeni, R'ye etiketin kategorik bir değişken olduğunu söylememenizdir. read.csvFonksiyon çalışır her sütun için kullanmak ne tür tahmin ve buna kullanacağı ne o zaman sayısal sütununda benziyor eğer. R strişlevini kullanarak değişkenin nasıl saklandığını kontrol edebilirsiniz . read.csvDeğişkeni kullanarak değişkeni bir faktör (veya sayısal veya ...) olarak okumaya zorlayabilirsiniz colClasses. Veya factorişlevi kullanırken okuduktan sonra etiketleri bir faktöre değiştirebilirsiniz .

Durum böyle değilse, verileriniz hakkında daha fazla bilgiye ihtiyacımız var. strVeri çerçevenizde çalışmanın sonuçları muhtemelen yararlı olacaktır.

— Greg Snow
kaynak