“Normalleştirme” ne demektir ve bir numunenin veya dağılımın normalleştirildiğini nasıl doğrulayabilirim?

19

Tekdüze dağılımın ( olup olmadığını doğrulamak istediğini soran bir sorum var ${\rm Uniform}(a,b)$ ) normal .

Birincisi, herhangi bir dağılımın normalleştirilmesi ne demektir?
Ve ikincisi, bir dağılımın normal olup olmadığını nasıl kontrol edeceğiz?

hesaplayarak anlıyorum

\frac{X - mean}{sd}

$\frac{X-\text{mean}}{\text{sd}}$ normalleştirilmişverialıyoruz, ancak burada birdağıtımınnormalleştirilmişolup olmadığını doğrulamak istiyor.

— Ada
kaynak

3

Bir dağılımın normalleştirilmesinin anlamı o kadar basit değildir (ve genellikle dağılımın normalleştirilmesi değil, rastgele değişken). Örneğin, üniforma söz konusu olduğunda, bazı insanlar "standart üniforma elde etmek için doğrusal olarak yeniden ölçeklenmiş" anlamına gelebilir (yani

ve

) ... başka bir kişi " ortalama 0 ve sd 1 olsun ". Üniforma için, normalde ilkini kabul ederdim, ancak aşağıdaki bir cevaptan da gördüğünüz gibi, diğer insanlar bunu başka bir şey anlamına gelebilir. En iyi seçenek terimi kullanan kişiden daha az belirsiz olmasını istemektir.

a = 0

$a=0$

b = 1

$b=1$

— Glen_b -Mons Monica'ya

1

Daha geleneksel terimler standartlaştırılır (ortalama sıfır ve SD'nin birini elde etmek için) ve normalleştirilir (aralığı

aralığına getirmek veya bir vektör normunu

yeniden ölçeklendirmek için ). Bu nedenle yeniden ekspresyonu,

a, standardizasyon yoğunluğu çarparak ise

bir sabit ile

yapmak

[0, 1]

$[0,1]$

1

$1$

X \to (X - mean) / S D

$X\to (X-\text{mean})/SD$

f

$f$

C

$C$

olan bir

\int_{- \infty}^{\infty} C f (x) d x = 1

$\int_{-\infty}^\infty Cf(x)dx=1$ normalizasyon , çünkü

olan

normu

.

\int f (x) d x

$\int f(x)dx$

L^{1}

$L^1$

f

$f$

— whuber

Ayrıca matematikte de sordu.

— Dilip Sarwate

1

Lütfen çapraz gönderi yapmayın, @Ada. Bu SE politikasına aykırıdır. 1 siteye Q gönderiyorsanız ve daha sonra başka bir siteye göndermeniz gerektiğini düşünüyorsanız, Q'nuzu işaretleyin ve moderatörlerden sizin için taşımasını isteyin.

— gung - Monica'yı eski durumuna döndürün

34

Ne yazık ki, terimler farklı alanlarda, aynı alandaki farklı kişiler tarafından farklı şekilde kullanılır, bu yüzden bunun sizin için ne kadar iyi cevaplanabileceğinden emin değilim. Eğitmeninizin / ders kitabının "normalleştirilmiş" için kullandığı tanımı bildiğinizden emin olmalısınız. Ancak, bazı yaygın tanımlar şunlardır:

Ortalanmış: Standart:

X - m e a n

$X-{\rm mean}$

Normalize:

\frac{X - mean}{sd}

$\frac{X-\text{mean}}{\text{sd}}$

Bu anlamdanormalleştirmeverilerinizi birim aralığına yeniden ölçeklendirir. Standardizasyon, @Jeff notları gibiverilerinizi

skorlarınadönüştürür. Vemerkezlemeverilerinizin ortalamasını

eşitler.

\frac{X - min (X)}{max (X) - min (X)}

$\frac{X-\min(X)}{\max(X)-\min(X)}$

z

$z$

0

$0$

Burada bunların üçünün de doğrusal dönüşümler olduğunu fark etmeye değer ; bu nedenle, dağıtımınızın şeklini değiştirmezler . Bu bazen insanlar çağrı, bir nedeniyle, -score dönüşüm "normalizasyon" ve inanıyoruz bu normal olarak veri yapılan dağılmış olduğu, normal dağılım ile -scores birliği. Bu böyle değildir (@Jeff'in de not ettiği gibi, verilerinizi önce ve sonra çizerek anlayabileceğiniz gibi). İlgilenmeniz halinde, örneğin Box-Cox dönüşüm ailesini kullanarak verilerinizin şeklini değiştirebilirsiniz . $z$ $z$

Bu dönüşümleri nasıl doğrulayabileceğiniz konusunda , bunun tam olarak ne anlama geldiğine bağlı. Basitçe kodun düzgün çalışıp çalışmadığını kontrol etmek istiyorlarsa, ortalamaları, SD'leri, minimumları ve maksimumları kontrol edebilirsiniz.

— gung - Monica'yı eski durumuna döndürün
kaynak

1

Ben standartlaştırılmış veya standart bir normal dağılım üzerine takılmış önermek için kullanılan normalleştirilmiş gördüm yani

Φ^{- 1} (F (X))

$\Phi^{-1}(F(X))$ , yani normalleştirilmiş üç tanesinin büyük olasılıkla yanlış anlaşılması muhtemeldir. Ada'nın bir olasılık fonksiyonuna normalleştirici bir sabitin uygulanması hakkındaki yorumu , yine bir başka olası yorumdur.

— Henry

4

Numunenizdeki her puan için sağladığınız formülü kullanarak hepsini z puanlarına dönüştürüyorsunuz .

Tüm z skorlarını doğru hesapladığınızı doğrulamak için, örneğinizin yeni ortalama ve standart sapmasını bulun. Ortalama $0$ ve standart sapma $1$ , her şeyi doğru yaptın.

Bunu yapmanın amacı, numunenizin standart sapmasına göre her şeyi birimlere koymaktır. Bu, farklı birimler (belki de santimetre ve inç) kullanılarak puanlanan iki farklı veri kümesinin karşılaştırılması gibi çeşitli amaçlar için yararlı olabilir.

It is important not to get this confused with asking whether a distribution is normal, i.e. whether it approximates a Gaussian distribution.

— Jeff
kaynak

so to check whether or not the Uniform distribution was normalized would it be equivalent to say E(X) = 0 and Var(X) = 1 where X~Uniform(a,b)?

2

the data do not even have to be from a uniform distribution, they can be from any distribution. also, this is only true using the formula you provided; data can be normalized in ways other than using z-scores. for instance, IQ scores are said to be normalized with a score of 100 and standard deviation of 15.

— Jeff

1

After consulting the TA, what the question was asking was whether if

\int_{- \infty}^{\infty} f (x) d x = 1

$\int_{-\infty}^{\infty}f(x)dx=1$

where $f(x)$ in this case is the density of the uniform(a,b).

— Ada
kaynak

2

The terminology to use here is that the probability density function of the distribution is normalized. Because this reflects the axiomatic fact that the total probability must equal

1

$1$ , asking whether any distribution itself is normalized (in this sense) always has the same trivial answer: of course.

— whuber

This is what we are asked to verify. f(x) doesn't really have to be a pdf, and it can be any non-negative function. For any non-negative function where the above doesn't satisfy, we can always multiply by a normalizing constant

— Ada

1

Not always. For instance, let

f (x) = e^{- x}

$f(x)=e^{-x}$ , a non-negative function defined on all the real numbers: there is no normalizing constant. But when you are told, as in your question statement, that "so-and-so is the PDF for such-and-such a distribution" then there is nothing whatsoever to verify: by definition it integrates to unity.

— whuber

It's true not any non-negative function where we can make it satisfy the above condition even if we multiply by a normalizing constant.

— Ada