R'de rastgele bir orman modeli kullanarak tahminler yapmaya çalışıyorum.
Ancak bazı faktörlerin test setinde eğitim setinden farklı değerlere sahip olduğundan hata alıyorum. Örneğin, bir faktörün test setinde egzersiz setinde görünmeyen Cat_2
değerler 34, 68, 76
vb. Vardır. Ne yazık ki, Test seti üzerinde kontrolüm yok ... Onu olduğu gibi kullanmalıyım.
Benim tek geçici çözüm kullanarak sorunlu faktörleri tekrar sayısal değerlere dönüştürmek oldu as.numeric()
. O çalışır ancak bu değerler hiçbir sayısal duygusu var kodlardır beri çok memnun değilim ...
Yeni değerleri test setinden çıkarmak için başka bir çözüm olacağını düşünüyor musunuz? Ancak 1, 2, 14, 32
hem eğitimde hem de testte bulunan ve tahminler için potansiyel olarak yararlı bilgiler içeren diğer tüm faktör değerlerini (değerleri söyleyin , vb.) Kaldırmadan .