Bunu yapmanın en iyi yolu , gerçekleştirdiğiniz göreve göre büyük ölçüde değişecektir , bu nedenle görevden bağımsız olarak en iyi neyin olacağını söylemek imkansızdır.
Seviyeleriniz sıralıysa denemek için iki kolay şey vardır:
- Çöp kutusu. Örneğin, 0 = (0 250), 1 = (251 500), vb. Her bölmenin eşit sayıda öğeye sahip olması için sınırları seçmek isteyebilirsiniz.
- Ayrıca seviyelerin bir günlük dönüşümü de alabilirsiniz. Bu menzili düşürecektir.
Düzeyler sıralı değilse, düzeyleri veri kümenizdeki diğer özelliklere / değişkenlere göre kümeleyebilir ve önceki düzeyler için küme kimliklerini kullanabilirsiniz. Kümeleme algoritmaları olduğu için bunu yapmanın birçok yolu vardır, bu nedenle alan tamamen açıktır. Okuduğumda, işte combine.levels()
olan bu . Benzer şekilde kmeans()
veya öğesini kullanarak da yapabilirsiniz prcomp()
. (Daha sonra yeni veri noktaları için kümeleri tahmin etmek üzere bir sınıflandırıcıyı eğitebilir / eğitebilirsiniz.)