«normalization» etiketlenmiş sorular

Genellikle "normalleştirme", değerleri belirli bir aralıkta tutmak için verilerin yeniden ifade edilmesi anlamına gelir.


5
Normalizasyon ve Standardizasyon arasındaki fark nedir?
İşyerinde bunu, patronum normalleşmeyi hiç duymadığı için tartışıyorduk. Lineer Cebir'de Normalizasyon, bir vektörün boyuna bölünmesini ifade eder. Ve istatistiklerde, Standardizasyon bir ortalamanın çıkarılmasını ve ardından SD'ye bölünmesini ifade ediyor gibi görünmektedir. Ancak, diğer olasılıklarla da birbirleriyle değiştirilebilir gibi görünüyorlar. Bir çeşit evrensel puan oluştururken , bu, farklı araçlara ve farklı …


9
Normalleştirme ve özellik ölçeklendirme nasıl ve neden çalışır?
Birçok makine öğrenme algoritmasının ortalama iptal ve kovaryans eşitleme ile daha iyi çalıştığını görüyorum. Örneğin, Sinir Ağları daha hızlı birleşme eğilimi gösterir ve K-Means genellikle önceden işlenmiş özelliklerle daha iyi kümeleme sağlar. Bu ön işleme adımlarının ardındaki sezginin performansın yükselmesine neden olduğunu görmüyorum. Biri bunu bana açıklayabilir mi?

3
Model doğrulamasından önce veya içinde özellik normalizasyonu yapılıyor mu?
Makine Öğreniminde yaygın olarak kullanılan iyi bir uygulama, yordayıcı değişkenlerinin normalleştirilmesi veya veri standardizasyonu yapmaktır, işte bu, ortalamayı veren veriyi ortalamak ve varyansa (veya standart sapma ile) bölerek normalleştirmektir. Kendini kapsama ve anlamam için bunu iki ana şeyi başarmak için yapıyoruz: Sayısal stabilite amacıyla ekstra küçük model ağırlıklarından kaçının. Örneğin, …

1
Öngörü hedefi ise standartlaştırma / normalizasyon eğitimi ve test setine nasıl uygulanır?
Tüm verilerimi veya katlamalarımı (CV uygulanmışsa) aynı anda mı değiştirebilirim? Örneğin (allData - mean(allData)) / sd(allData) Tren seti ve test setini ayrı ayrı değiştirebilir miyim? Örneğin (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Yoksa tren takımını değiştirip test setinde hesaplamaları kullanabilir miyim? Örneğin (trainData - mean(trainData)) / …

4
Normalleştirme ve ölçeklendirme
'Normalizasyon' ve 'Ölçekleme' verileri arasındaki fark nedir? Şimdiye dek her iki terimin de aynı işlemi ifade ettiğini düşündüm ama şimdi bilmediğim / anlamadığım bir şey olduğunu fark ediyorum. Ayrıca Normalizasyon ve Ölçekleme arasında bir fark varsa, Normalizasyon'u ne zaman kullanmalıyız, ancak Ölçekleme'yi kullanmamalıyız (ve bunun tersi? Lütfen bir örnek veriniz.




8
Sınırsız bir değişkeni 0 ile 1 arasında sayı olarak gösterme
Bir değişkeni 0 ile 1 arasında bir sayı olarak temsil etmek istiyorum. Değişken, doğal bir sınırı olmayan negatif olmayan bir tam sayıdır. 0 - 0 arasında eşlerim, ancak 1 ile 0 arasındaki rakamları ne eşleyebilirim? Limitleri sağlamak için bu değişkenin geçmişini kullanabilirim. Bu, eğer maksimum artış olursa eski istatistikleri yeniden …

2
Kement'ten önce standardizasyon gerçekten gerekli midir?
LassoRegresyon gibi bir şeyden önce değişkenleri standartlaştırmanın üç ana nedenini okudum : 1) Katsayıların yorumlanabilirliği. 2) Katsayı önemini büzülme sonrası katsayı tahminlerinin göreceli büyüklüğü ile sıralama yeteneği. 3) Kesişmeye gerek yok. Ama en önemli noktayı merak ediyorum. Standardizasyonun modelin örnek genellemesinin dışına çıkacağını düşünmek için bir nedenimiz var mı? Ayrıca, …

2
Kosinüs benzerliği l2 normalize öklid mesafesine eşit mi?
Özdeş bir vektör arasındaki bir sıralama benzerliği için benzer sonuçlar üretecek anlamı, u ve vektörler bir dizi V . Parametre olarak uzaklık ölçüsü (öklid mesafesi, kosinüs benzerliği) ve normalizasyon tekniğine (hiç, l1, l2) sahip bir vektör uzayı modelim var. Anladığım kadarıyla, [cosine, none] ayarlarının sonuçları aynı veya en azından gerçekten …

5
Hiç ikili değişkenleri standartlaştırmalı mıydınız?
Bir dizi özelliğe sahip bir veri setim var. Bazıları ikilidir aktif veya ateşlenmiş, etkin değil veya hareketsiz) ve gerisi gerçek , örneğin .0 = 4564.342)( 1 =(1=(1=0 =0=0=4564.3424564.3424564.342 Bu verileri bir makine öğrenme algoritmasına beslemek istiyorum, bu yüzden tüm gerçek değerli özellikleri puanladım. Onları yaklaşık ila arasında buluyorum . Şimdi …

1
Satır ve sütun uzunluğu üzerindeki kısıtlamaları olan rastgele matrisler
satırları ve sütunlarıyla rastgele kare olmayan matrisler oluşturmalı, rasgele ortalama = 0 ile dağıtılmış elemanlar oluşturmalı ve her satırın uzunluğu (L2 normu) ve her sütunun uzunluğu kısıtlanmalı. . Eşdeğer olarak, her satır için kare değerlerin toplamı 1 ve her sütun için .C 1 √R,RRCCC111 RR,C--√RC\sqrt{\frac{R}{C}}R,CRC\frac{R}{C} Şimdiye kadar bunu başarmanın bir …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.