-1 ile 1 arasındaki veriler nasıl normalleştirilir?

Min-max normalizasyon formülünü gördüm ama bu değerleri 0 ile 1 arasında normalleştirir. Verilerimi -1 ile 1 arasında nasıl normalleştiririm? Veri matrisimde hem negatif hem de pozitif değerler var.

dataset normalization

— covfefe
kaynak

R'de çalışıyorsanız, birkaç seçenek için bu konuya bakın . Özellikle, kabul edilen cevaba yapılan bir yorum, 'newMax' değerini 1 ve 'newMin' değerini -1 olarak ayarladığınız ve işlevi verileriniz üzerinde çalıştıran bu işleve sahiptir

— mtreg

Vikipedi'de referansı şu şekilde bulabilirsiniz: en.wikipedia.org/wiki/Normalization_(statistics)

— salem

Javascript örneği, buradan alınmıştır . convertRange işlevi (değer, r1, r2) {return (değer - r1 [0]) * (r2 [1] - r2 [0]) / (r1 [1] - r1 [0]) + r2 [0]; } convertRange (328.17, [300.77, 559.22], [1, 10]); >>> 1.9541497388276272

— Giuseppe Canale

@covfefe, hala etrafınızdaysa, cevaplardan birini kabul etmek isteyebilirsiniz

— Simone

Yanıtlar:

İle: bulunduğunuz özelliğin normalleştirmekiçinde.

x^{'} = \frac{x - min x}{max x - min x}

$x' = \frac{x - \min{x}}{\max{x} - \min{x}}$

x

$x$

[0, 1]

$[0,1]$

içinde normalleştirmek için kullanabilirsiniz: $[-1,1]$

x^{"} = 2 \frac{x - min x}{maksimum x - min x} - 1

$x'' = 2\frac{x - \min{x}}{\max{x} - \min{x}} - 1$

Genel olarak, her zaman yeni bir değişken alabilirsiniz içinde : $x'''$ $[a,b]$

x^{‴} = (b - a) \frac{x - min x}{max x - min x} + a

$x''' = (b-a)\frac{x - \min{x}}{\max{x} - \min{x}} + a$

— Simone
kaynak

Dürüst olmak gerekirse, bunun için alıntı yok. Bu sadece rastgele bir değişkenin doğrusal bir dönüşümüdür. Doğrusal dönüşümlerin rastgele değişkenin desteği üzerindeki etkisine bir göz atın.

— Simone

-1

Rasgele oluşturulmuş veriler üzerinde test ettim ve

X_{o u t} = (b - a) \frac{X_{i n} - min X_{i n}}{max X_{i n} - min X_{i n}} + a

$\begin{equation} X_{out} = (b-a)\frac{X_{in} - \min{X_{in}}}{\max{X_{in}} - \min{X_{in}}} + a \end{equation}$

dağıtım şeklini korumaz. Rastgele değişkenlerin fonksiyonlarını kullanarak bunun doğru türetilmesini gerçekten görmek isterdim.

Benim için şekli koruyan yaklaşım kullanıyordu:

X_{o u t} = \frac{X_{i n} - μ_{i n}}{σ_{i n}} \cdot σ_{o u t} + μ_{o u t}

$\begin{equation} X_{out} = \frac{X_{in} - \mu_{in}}{\sigma_{in}} \cdot \sigma_{out} + \mu_{out} \end{equation}$

nerede

σ_{o u t} = \frac{b - a}{6}

$\begin{equation} \sigma_{out} = \frac{b-a}{6} \end{equation}$

(6'yı kullanmanın biraz kirli olduğunu kabul ediyorum ) ve

μ_{O u t} = \frac{b + bir}{2}

$\begin{equation} \mu_{out} = \frac{b+a}{2} \end{equation}$

$a$ $b$ $a=-1$ ve $b=1$ .

Bu akıl yürütmenin sonucuna geldim

Z_{O u t} = Z_{ben n}

$\begin{equation} Z_{out} = Z_{in} \end{equation}$

\frac{X_{O u t} - μ_{O u t}}{σ_{O u t}} = \frac{X_{ben n} - μ_{ben n}}{σ_{ben n}}

$\begin{equation} \frac{X_{out} - \mu_{out}}{\sigma_{out}} = \frac{X_{in} - \mu_{in}}{\sigma_{in}} \end{equation}$

— AL Verminburger
kaynak

Bunun dönüştürülen verilerin sınırlar içinde kalmasını garanti ettiğinden emin misiniz? Ar şunları yapabilirsiniz: set.seed(1); scale(rnorm(1000))*.333. En fazla alacağım 1.230871. Metodunuz, verileri istendiği gibi normalleştirmek yerine, verileri standart hale getirme konusunda çok ince görünüyor. Sorunun dağılımın şeklini koruyan bir yöntem istemediğine dikkat edin (bu normalleştirme için garip bir gerekliliktir).

— dediklerinin - Eski Monica

Orijinal dönüşümün verilerin şeklini nasıl koruyamadığından emin olamadım. Bir sabiti çıkartıp ardından bir sabite bölmekle eşdeğerdir, bu da teklifinizin yaptığı ve verilerin şeklini değiştirmeyen şeydir. Teklifiniz, tüm verilerin ortalamanın üç standart sapmasına düştüğünü, bunun da küçük, yaklaşık olarak normal dağılıma sahip örneklerle biraz makul olabileceğini, ancak büyük olan veya normal olmayan örneklerle olabileceğini varsayar.

— Noah,

@Hayır Sabit değerlerle çıkarma ve bölmeye eşdeğer değildir , çünkü verilerin minimum ve maksimum değerleri rasgele değişkenlerdir. Aslında, çoğu temel dağıtım için bunlar oldukça değişkendir - verilerin geri kalanından daha değişkendir - bu nedenle onları herhangi bir standardizasyon için kullanmak genellikle iyi bir fikir değildir. Bu cevapta ne olduğu belli değil

a

$a$ ve

b

$b$ ortalama veya verilerle nasıl ilişkili olabileceği.

— whuber

@whuber true, ancak belirli bir veri kümesinde (yani, verileri sabit olarak işleme koyma), sabit oldukları anlamına gelir, aynı şekilde bir veri kümesini standartlaştırırken, örnek ortalama ve örnek standart sapma fonksiyonu sabitleridir. Benim izlenimim, OP'nin bir veri setini normalleştirmek istediği, bir dağılım değil.

— Nuh

@Hayır, aynı izlenime sahiptim, ancak şimdiki postanın farklı bir yorumlara cevap verebileceğine inanıyorum.

— whuber