«data-transformation» etiketlenmiş sorular

Veri değerlerinin genellikle doğrusal olmayan matematiksel yeniden ifadesi. Veriler genellikle bir istatistiksel modelin varsayımlarını karşılamak veya bir analizin sonuçlarını daha yorumlanabilir hale getirmek için dönüştürülür.

12
Sıfırlar dahil olmak üzere negatif olmayan verileri nasıl dönüştürmeliyim?
Olumlu verilerim çok eğrilmişse, genellikle günlükleri alırım. Fakat sıfır içeren, eğri, negatif olmayan verilerle ne yapmalıyım? Kullanılan iki dönüşüm gördüm: ile eşleşen düzgün bir özelliğe sahip olan log ( x + 1 ) .kütük( x + 1 )kütük⁡(x+1)\log(x+1) burada c tahmin edilir veya çok küçük bir pozitif değer olarak ayarlanır.kütük( …


2
Ne zaman (ve neden) bir dağıtım günlüğünü (sayıların) almalısınız?
Örneğin, geçmiş hisse senedi fiyatları, havayolu bilet fiyatı dalgalanmaları, şirketin geçmiş finansal verileri gibi bazı geçmiş verilere sahibim ... Şimdi birileri (ya da bazı formüller) gelir ve "hadi dağıtım günlüğünü alalım / kullanalım" der ve işte NEREYE GİTİRİM ? Sorular: Niçin birincisi dağıtım günlüğünü almalı? Dağıtım günlüğü, orijinal dağıtımın yapamayacağı …


1
Sayma verileri için karekök dönüşümü neden önerilir?
Sayılarınız varken karekök almanız önerilir. (CV bazı örnekler için HarveyMotulsky cevabı @ bakınız burada ya whuber cevabı @ burada Poisson olarak dağıtılan bir yanıt değişkeni bulunan genelleştirilmiş doğrusal modelin yerleştirilmesi sırasında.) Öte yandan, günlük olduğunu kurallı bağlantı . Bu, yanıt verilerinizin bir günlük dönüşümünü almak gibi bir şeydir (daha doğrusu …

5
Sıfır kütüğünün alınmaması için x'e ne kadar küçük bir miktar eklenmelidir?
Verilerimi olduğu gibi analiz ettim. Şimdi tüm değişkenlerin kaydını tuttuktan sonra analizlerime bakmak istiyorum. Birçok değişken birçok sıfır içerir. Bu nedenle, sıfır kütüğü almaktan kaçınmak için küçük bir miktar ekliyorum. Şimdiye kadar 10 ^ -10 ekledim, herhangi bir gerekçe olmadan, gerçekten, sadece çok küçük bir miktar eklemenin keyfi olarak seçilen …

8
Kategorik verileri sürekli olarak ele almak hiç mantıklı geliyor mu?
Kesin ve sürekli veri üzerine bu soruyu cevaplarken, kategorik verileri sürekli olarak ele almanın nadiren mantıklı olduğunu ileri sürdüm. Anlaşılır görünen, ancak sezgi genellikle istatistik için kötü bir rehber, ya da en azından benim. Şimdi merak ediyorum: doğru mu? Yoksa kategorik verilerden bir sürekliliğe dönüşümün gerçekten yararlı olduğu analizler var …

3
Log ölçekleri ne zaman uygun olur?
Zaman çizelgesi grafiğindeki y ekseni gibi, belirli durumlarda çizelgeleme / grafik oluşturma uygun olduğunda günlük ölçeklerini kullanmanın okudum. Ancak, bunun neden böyle olduğu veya ne zaman uygun olacağı konusunda kesin bir açıklama bulamadım. Lütfen aklınızda bulundurun, istatistikçi değilim, bu yüzden noktayı tamamen kaybediyor olabilirim ve eğer durum buysa, iyileştirici kaynakların …



1
Öngörü hedefi ise standartlaştırma / normalizasyon eğitimi ve test setine nasıl uygulanır?
Tüm verilerimi veya katlamalarımı (CV uygulanmışsa) aynı anda mı değiştirebilirim? Örneğin (allData - mean(allData)) / sd(allData) Tren seti ve test setini ayrı ayrı değiştirebilir miyim? Örneğin (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Yoksa tren takımını değiştirip test setinde hesaplamaları kullanabilir miyim? Örneğin (trainData - mean(trainData)) / …

3
Kütle dönüştürülmüş yordayıcının ve / veya tepkinin yorumlanması
Merak ediyorum, yorumlamada sadece bağımlı, bağımsız veya bağımsız değişkenlerin mi yoksa sadece bağımsız değişkenlerin log dönüşümünde mi olduğunu fark eder mi? Durumunu düşünün log(DV) = Intercept + B1*IV + Error IV'ü yüzde artış olarak değerlendirebilirim, ancak sahip olduğumda bu nasıl değişir? log(DV) = Intercept + B1*log(IV) + Error veya sahipken …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

4
Normalleştirme ve ölçeklendirme
'Normalizasyon' ve 'Ölçekleme' verileri arasındaki fark nedir? Şimdiye dek her iki terimin de aynı işlemi ifade ettiğini düşündüm ama şimdi bilmediğim / anlamadığım bir şey olduğunu fark ediyorum. Ayrıca Normalizasyon ve Ölçekleme arasında bir fark varsa, Normalizasyon'u ne zaman kullanmalıyız, ancak Ölçekleme'yi kullanmamalıyız (ve bunun tersi? Lütfen bir örnek veriniz.

1
Regresyon: Değişkenleri Dönüştürmek
Değişkenleri dönüştürürken, aynı dönüşümü kullanmanız gerekir mi? Örneğin, farklı dönüştürülmüş değişkenleri seçip seçebilir miyim: , Let yaş, istihdam süresi, yaşadıkları uzunluğu ve gelir olmak.x1, x2, x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Veya dönüşümlerinizle tutarlı olmanız ve hepsini kullanmanız mı gerekiyor? De olduğu gibi: Y = B1*log(x1) + B2*log(x2) …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.