K-NN için, verileri 0 ile 1 arasında normalleştirmenizi öneririm .01
k-NN, örnekleri karşılaştırma aracı olarak Öklid mesafesini kullanır . İki nokta arasındaki mesafeyi hesaplamak için, ve X 2 = ( f 1 2 , f 2 2 , . . . , F M 2 ) , f i 1 değeri ix1= ( f11, f21, . . . , fM1)x2= ( f12, f22, . . . , fM2)fben1ben- özelliği :x1
d( x1, x2) = ( f11- f12)2+ ( f21- f22)2+ . . . + ( fM1- fM2)2---------------------------------√
İçin için tüm özellikler olması eşit mesafe hesaplanırken önemi, özellikleri gereken değerler aynı aralığı vardır. Bu ancak normalleştirme ile elde edilebilir.
Bunlar Normalleştirilmeselerdi ve örneğin özelliği değerler bir dizi vardı [ 0 , 1 iken) f 2 değerler bir dizi vardı [ 1 , 10 ) . Mesafe hesaplanırken, ikinci terim birinciden 10 kat daha önemli olacaktır, bu da k-NN'nin birinciden daha fazla ikinci özelliğe güvenmesine neden olur. Normalleştirme, tüm özelliklerin aynı değer aralığına eşlenmesini sağlar .f1[ 0 , 1f2[ 1 , 10 )10
Diğer taraftan, standartlaştırma birçok yararlı özelliğe sahiptir, ancak özelliklerin aynı aralığa eşlendiğinden emin olamaz . Standardizasyon diğer sınıflandırıcılar için en uygun olsa da, k-NN veya başka herhangi bir mesafe bazlı sınıflandırıcı için geçerli değildir.