“Normalleştirme” ne demektir ve bir numunenin veya dağılımın normalleştirildiğini nasıl doğrulayabilirim?


19

Tekdüze dağılımın ( U n i f o r m ( a , b ) olup olmadığını doğrulamak istediğini soran bir sorum varUniform(a,b) ) normal .

  1. Birincisi, herhangi bir dağılımın normalleştirilmesi ne demektir?
  2. Ve ikincisi, bir dağılımın normal olup olmadığını nasıl kontrol edeceğiz?

X hesaplayarak anlıyorum - mean

Xmeansd
normalleştirilmişverialıyoruz, ancak burada birdağıtımınnormalleştirilmişolup olmadığını doğrulamak istiyor.

3
Bir dağılımın normalleştirilmesinin anlamı o kadar basit değildir (ve genellikle dağılımın normalleştirilmesi değil, rastgele değişken). Örneğin, üniforma söz konusu olduğunda, bazı insanlar "standart üniforma elde etmek için doğrusal olarak yeniden ölçeklenmiş" anlamına gelebilir (yani ve b = 1 elde etmek için ) ... başka bir kişi " ortalama 0 ve sd 1 olsun ". Üniforma için, normalde ilkini kabul ederdim, ancak aşağıdaki bir cevaptan da gördüğünüz gibi, diğer insanlar bunu başka bir şey anlamına gelebilir. En iyi seçenek terimi kullanan kişiden daha az belirsiz olmasını istemektir. a=0b=1
Glen_b -Mons Monica'ya

1
Daha geleneksel terimler standartlaştırılır (ortalama sıfır ve SD'nin birini elde etmek için) ve normalleştirilir (aralığı aralığına getirmek veya bir vektör normunu 1'e yeniden ölçeklendirmek için ). Bu nedenle yeniden ekspresyonu, X ( X - ortalama ) / S D a, standardizasyon yoğunluğu çarparak ise f bir sabit ile C yapmak - f ( x ) D X =[0,1]1X(Xmean)/SDfC olan birCf(x)dx=1 normalizasyon , çünkü olan L 1 normu f . f(x)dxL1f
whuber

Ayrıca matematikte de sordu.
Dilip Sarwate

1
Lütfen çapraz gönderi yapmayın, @Ada. Bu SE politikasına aykırıdır. 1 siteye Q gönderiyorsanız ve daha sonra başka bir siteye göndermeniz gerektiğini düşünüyorsanız, Q'nuzu işaretleyin ve moderatörlerden sizin için taşımasını isteyin.
gung - Monica'yı eski durumuna döndürün

Yanıtlar:


34

Ne yazık ki, terimler farklı alanlarda, aynı alandaki farklı kişiler tarafından farklı şekilde kullanılır, bu yüzden bunun sizin için ne kadar iyi cevaplanabileceğinden emin değilim. Eğitmeninizin / ders kitabının "normalleştirilmiş" için kullandığı tanımı bildiğinizden emin olmalısınız. Ancak, bazı yaygın tanımlar şunlardır:

Ortalanmış: Standart: X - ortalama

Xmean
Normalize:X-min(X)
Xmeansd
Bu anlamdanormalleştirmeverilerinizi birim aralığına yeniden ölçeklendirir. Standardizasyon, @Jeff notları gibiverilerinizizskorlarınadönüştürür. Vemerkezlemeverilerinizin ortalamasını0'aeşitler.
Xmin(X)max(X)min(X)
z0

Burada bunların üçünün de doğrusal dönüşümler olduğunu fark etmeye değer ; bu nedenle, dağıtımınızın şeklini değiştirmezler . Bu bazen insanlar çağrı, bir nedeniyle, -score dönüşüm "normalizasyon" ve inanıyoruz z bu normal olarak veri yapılan dağılmış olduğu, normal dağılım ile -scores birliği. Bu böyle değildir (@Jeff'in de not ettiği gibi, verilerinizi önce ve sonra çizerek anlayabileceğiniz gibi). İlgilenmeniz halinde, örneğin Box-Cox dönüşüm ailesini kullanarak verilerinizin şeklini değiştirebilirsiniz . zz

Bu dönüşümleri nasıl doğrulayabileceğiniz konusunda , bunun tam olarak ne anlama geldiğine bağlı. Basitçe kodun düzgün çalışıp çalışmadığını kontrol etmek istiyorlarsa, ortalamaları, SD'leri, minimumları ve maksimumları kontrol edebilirsiniz.


1
Ben standartlaştırılmış veya standart bir normal dağılım üzerine takılmış önermek için kullanılan normalleştirilmiş gördüm yaniΦ-1(F(X)), yani normalleştirilmiş üç tanesinin büyük olasılıkla yanlış anlaşılması muhtemeldir. Ada'nın bir olasılık fonksiyonuna normalleştirici bir sabitin uygulanması hakkındaki yorumu , yine bir başka olası yorumdur.
Henry

4

Numunenizdeki her puan için sağladığınız formülü kullanarak hepsini z puanlarına dönüştürüyorsunuz .

Tüm z skorlarını doğru hesapladığınızı doğrulamak için, örneğinizin yeni ortalama ve standart sapmasını bulun. Ortalama0 ve standart sapma 1, her şeyi doğru yaptın.

Bunu yapmanın amacı, numunenizin standart sapmasına göre her şeyi birimlere koymaktır. Bu, farklı birimler (belki de santimetre ve inç) kullanılarak puanlanan iki farklı veri kümesinin karşılaştırılması gibi çeşitli amaçlar için yararlı olabilir.

It is important not to get this confused with asking whether a distribution is normal, i.e. whether it approximates a Gaussian distribution.


so to check whether or not the Uniform distribution was normalized would it be equivalent to say E(X) = 0 and Var(X) = 1 where X~Uniform(a,b)?

2
the data do not even have to be from a uniform distribution, they can be from any distribution. also, this is only true using the formula you provided; data can be normalized in ways other than using z-scores. for instance, IQ scores are said to be normalized with a score of 100 and standard deviation of 15.
Jeff

1

After consulting the TA, what the question was asking was whether if

f(x)dx=1

where f(x) in this case is the density of the uniform(a,b).


2
The terminology to use here is that the probability density function of the distribution is normalized. Because this reflects the axiomatic fact that the total probability must equal 1, asking whether any distribution itself is normalized (in this sense) always has the same trivial answer: of course.
whuber

This is what we are asked to verify. f(x) doesn't really have to be a pdf, and it can be any non-negative function. For any non-negative function where the above doesn't satisfy, we can always multiply by a normalizing constant
Ada

1
Not always. For instance, let f(x)=ex, a non-negative function defined on all the real numbers: there is no normalizing constant. But when you are told, as in your question statement, that "so-and-so is the PDF for such-and-such a distribution" then there is nothing whatsoever to verify: by definition it integrates to unity.
whuber

It's true not any non-negative function where we can make it satisfy the above condition even if we multiply by a normalizing constant.
Ada
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.