Ne yazık ki, terimler farklı alanlarda, aynı alandaki farklı kişiler tarafından farklı şekilde kullanılır, bu yüzden bunun sizin için ne kadar iyi cevaplanabileceğinden emin değilim. Eğitmeninizin / ders kitabının "normalleştirilmiş" için kullandığı tanımı bildiğinizden emin olmalısınız. Ancak, bazı yaygın tanımlar şunlardır:
Ortalanmış:
Standart: X - ortalama
X−mean
Normalize:X-min(X)X−meansd
Bu anlamda
normalleştirmeverilerinizi birim aralığına yeniden ölçeklendirir.
Standardizasyon, @Jeff notları gibiverilerinizi
zskorlarınadönüştürür. Ve
merkezlemeverilerinizin ortalamasını
0'aeşitler.
X−min(X)max(X)−min(X)
z0
Burada bunların üçünün de doğrusal dönüşümler olduğunu fark etmeye değer ; bu nedenle, dağıtımınızın şeklini değiştirmezler . Bu bazen insanlar çağrı, bir nedeniyle, -score dönüşüm "normalizasyon" ve inanıyoruz z bu normal olarak veri yapılan dağılmış olduğu, normal dağılım ile -scores birliği. Bu böyle değildir (@Jeff'in de not ettiği gibi, verilerinizi önce ve sonra çizerek anlayabileceğiniz gibi). İlgilenmeniz halinde, örneğin Box-Cox dönüşüm ailesini kullanarak verilerinizin şeklini değiştirebilirsiniz . zz
Bu dönüşümleri nasıl doğrulayabileceğiniz konusunda , bunun tam olarak ne anlama geldiğine bağlı. Basitçe kodun düzgün çalışıp çalışmadığını kontrol etmek istiyorlarsa, ortalamaları, SD'leri, minimumları ve maksimumları kontrol edebilirsiniz.