«data-transformation» etiketlenmiş sorular

Veri değerlerinin genellikle doğrusal olmayan matematiksel yeniden ifadesi. Veriler genellikle bir istatistiksel modelin varsayımlarını karşılamak veya bir analizin sonuçlarını daha yorumlanabilir hale getirmek için dönüştürülür.


2
Sıra korelasyonu ile kanonik korelasyon analizi
Kanonik korelasyon analizi (CCA), iki veri setinin lineer kombinasyonlarının normal Pearson ürün-moment korelasyonunu (yani doğrusal korelasyon katsayısı) maksimize etmeyi amaçlamaktadır. Şimdi, bu korelasyon katsayısının sadece doğrusal ilişkileri ölçtüğünü düşünün - bu, örneğin, rastgele monoton (mutlaka zorunlu olmayan) ölçen Spearman- veya Kendall- (sıra) korelasyon katsayılarını da kullanmamızın sebebidir. değişkenler arasındaki bağlantı.ρρ\rhoττ\tau …


2
Veri Dönüştürme: Tüm değişkenler mi yoksa sadece normal olmayanlar mı?
Andy Field'ın SPSS Kullanarak İstatistikleri Keşfederken tüm değişkenlerin dönüştürülmesi gerektiğini belirtir. Ancak yayında: "Coğrafi ağırlıklı regresyon I: arazi tasarımı ve su kalitesi arasındaki mekansal olarak değişen ilişkilerin incelenmesi": Model tasarımı ve değerlendirmesi "özellikle sadece normal olmayan değişkenlerin dönüştürüldüğünü belirtirler. Bu analiz spesifik mi? Örneğin, ortalamaların karşılaştırılmasında, günlüklerin ham verilerle karşılaştırılması …


1
Verileri İstenen Ortalama ve Standart Sapmaya Dönüştürün
Veri kümemi geçerli ortalamasından standart sapmasından hedef ortalamaya ve standart sapmaya dönüştürmek için bir yöntem arıyorum. Temel olarak, dispersiyonu küçültmek / genişletmek ve tüm sayıları ortalamaya ölçeklemek istiyorum. Biri standart sapma için ve diğeri ortalama için olmak üzere iki ayrı doğrusal dönüşüm yapmak için işe yaramaz. Hangi yöntemi kullanmalıyım? Çözüm …

1
Sinir ağlarında ikili ve sürekli girdilerin bir karışımıyla nasıl başa çıkılır?
Kınamak için emlak fiyatları (kişisel proje) tahmin etmek için bir YSA oluşturmak için R nnet paketini kullanıyorum. Ben bu konuda yeniyim ve matematik geçmişim yok, bu yüzden lütfen bana çıplak. Hem ikili hem de sürekli girdi değişkenleri var. Örneğin, başlangıçta evet / hayır olan bazı ikili değişkenler, sinir ağı için …



1
Entropi yere ve ölçeğe nasıl bağlıdır?
Entropi yoğunluk fonksiyonu sürekli bir dağılım beklentisine negatif olarak tanımlanır ve bu yüzden eşitffflog(f),log⁡(f),\log(f), Hf=−∫∞−∞log(f(x))f(x)dx.Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. Ayrıca dağılımı yoğunluğuna sahip herhangi bir rastgele değişken entropi (Bu integral, sıfırları olduğunda bile iyi tanımlanmıştır , çünkü bu değerlerde sıfıra alınabilir.)XXXfffHf.Hf.H_f.ffflog(f(x))f(x)log⁡(f(x))f(x)\log(f(x))f(x) Zaman ve bu rastgele değişkenlerin ( bir sabittir), bir …

3
kukla değişkenleri merkezleme ve ölçeklendirme
Hem kategorik değişkenleri hem de sürekli değişkenleri içeren bir veri setim var. Kategorik değişkenleri her seviye için ikili değişkenler olarak dönüştürmem önerildi (yani, A_level1: {0,1}, A_level2: {0,1}) - Bence bazıları buna "kukla değişkenler" adını verdiler. Bununla birlikte, tüm veri kümesini yeni değişkenlerle ortalamak ve ölçeklendirmek yanıltıcı olur mu? Değişkenlerin "açık …

3
Aşırı çarpık dağılımları dönüştürme
Dağılımını çok yüksek bir dereceye kadar eğriltmiş bir değişkenim olduğunu varsayalım, böylece günlük almak, normal dağılım için eğrilik aralığı içine getirmek için yeterli olmayacaktır. Bu noktada seçeneklerim neler? Değişkeni normal bir dağılıma dönüştürmek için ne yapabilirim?

4
Ağır kuyruklu dağıtımlar için boxplot eşdeğeri?
Yaklaşık olarak normal olarak dağıtılmış veriler için kutu grafikleri, medyanı ve verilerin yayılmasını ve ayrıca herhangi bir aykırı değerlerin varlığını hızlı bir şekilde görselleştirmenin harika bir yoludur. Bununla birlikte, daha ağır kuyruklu dağılımlar için, uç noktalar IQR'nin sabit faktörünün dışında olduğu tanımlandığından ve çok kuyruklu dağılımlarda elbette çok daha sık …



Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.