Normalleştirme ve ölçeklendirme


45

'Normalizasyon' ve 'Ölçekleme' verileri arasındaki fark nedir? Şimdiye dek her iki terimin de aynı işlemi ifade ettiğini düşündüm ama şimdi bilmediğim / anlamadığım bir şey olduğunu fark ediyorum. Ayrıca Normalizasyon ve Ölçekleme arasında bir fark varsa, Normalizasyon'u ne zaman kullanmalıyız, ancak Ölçekleme'yi kullanmamalıyız (ve bunun tersi?

Lütfen bir örnek veriniz.


6
Normalleştirme, tipik olarak, gözlemlerinizi , normal dağılmış gibi görünecek şekilde f ( x ) ( f , ölçülebilir, tipik olarak sürekli bir fonksiyondur) haline dönüştürmek anlamına gelir . Verileri normalleştirmek için bazı dönüşüm örnekleri güç dönüşümleridir . Ölçekleme, basitçe f ( x ) = c x , c R anlamına gelir , bu, gözlemlerinizi ölçeği değiştiren bir sabit c ile çarpmaktır (örneğin nanometreden kilometreye). xf(x)ff(x)=cxcRc


normalleştirme de standardizasyonla aynı olan bir ölçeklendirme yöntemidir

Yanıtlayacak istatistiklerle ilgili yeterli itibarım yok. Bence sorunuzun adı Normalizasyona Karşı Standardizasyon olmalı, çünkü bu ikisi farklı ölçeklendirme yaklaşımları. Normalleştirme, değerleri 0 ve 1 aralığında yeniden ölçeklendirirken, standardizasyon dağılımı ortalama 0 ve standart sapma 1 olacak şekilde kaydırır.
Hamid Heydarian

Yanıtlar:


23

“Resmi” bir tanımın farkında değilim ve orada olsa bile, pratikte tutarsız bir şekilde kullanıldığını göreceğiniz gibi ona güvenmemelisiniz.

Bu söylenirse, istatistiklerde ölçeklendirme genellikle biçiminin doğrusal bir dönüşümü anlamına gelir .f(x)=ax+b

Normalleştirme, verileri dönüştürmek için bir dönüşüm uygulamak anlamına gelebilir, kabaca normalde dağıtılır, ancak aynı zamanda farklı ölçekleri ortak bir ölçekte koymak anlamına da gelebilir. Ortalamanın çıkarılması ve standart sapmaya bölünmesi anlamına gelen standartlaştırma, daha sonraki kullanımlara bir örnektir. Gördüğünüz gibi bu da bir ölçeklendirme örneği. İlki için bir örnek lognormal dağıtılmış veriler için log almaktır.

Ancak almanız gereken şey, okuduğunuzda yazarın yaptıklarının daha kesin bir tanımını aramanız gerektiğidir. Bazen bağlamdan elde edebilirsiniz.


14

Ölçekleme, sayıları doğru hissettirmek için kişisel bir seçimdir, örneğin sıfır ile bir veya bir ile yüz arasında. Örneğin milimetre cinsinden verilen verileri metrelere dönüştürmek, çünkü daha uygun veya metrikse emperyaldir.

Normalleştirme, dış bir 'standarda' ölçeklendirme ile ilgili olmakla birlikte - yerel norm - ortalama değerin kaldırılması ve örnek standart sapma ile bölünmesi, örneğin, sıralanan verilerinizin toplu bir normal ya da toplu bir Poisson ile karşılaştırılabilmesi için, ya da her neyse.

Bir öğretim üyesi veya yönetici veriyi 'normalize etmek' isterse, bu " yolumu yeniden ölçeklendir" anlamına gelir ;-)


9

Tam olarak bunu mu kastediyorsunuz bilmiyorum, ama Normalizasyon anlamında veri Standardizasyonu yazan birçok insan görüyorum. Standardizasyon verilerinizi dönüştürür, bu nedenle ortalama 0 ve standart sapma 1 olacaktır:

x <- (x - mean(x)) / sd(x)

Verilerinizi 0-1 aralığına dönüştürürken, Veri Ölçeklendirme için Normalleştirme terimini kullanan kişileri de görüyorum:

x <- (x - min(x)) / (max(x) - min(x))

Kafa karıştırıcı olabilir!

Her iki tekniğin de artıları ve eksileri var. Çok fazla aykırı olan bir veri kümesini ölçeklerken, aykırı olmayan verileriniz çok küçük bir aralıkta bitebilir. Eğer veri setinizde çok fazla aykırı değer varsa, onu Standartlaştırmayı düşünebilirsiniz. Bununla birlikte, bunu yaptığınızda negatif verilerle (bazen bunu istemezsiniz) ve sınırsız verilerle (bunu istemeyebilirsiniz) sonuçlanırsınız.


3

Merkezleme, rastgele değişkenin ortalamasının değişkenlerden çıkarılması anlamına gelir. Yani x -xi

Ölçeklendirme, değişkeni standart sapmasına göre bölmek anlamına gelir. Yani xi / s

İkisinin birleşimi normalleşme veya yeniden dengeleme olarak adlandırılır. Yani x-xi / s


Soru bir kopyasıdır.
Michael Chernick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.