«data-transformation» etiketlenmiş sorular

Veri değerlerinin genellikle doğrusal olmayan matematiksel yeniden ifadesi. Veriler genellikle bir istatistiksel modelin varsayımlarını karşılamak veya bir analizin sonuçlarını daha yorumlanabilir hale getirmek için dönüştürülür.

2
Mevsimsel ayrışma yönteminin seçilmesi
Mevsimsel düzeltme , daha ileri araştırmalar için verilerin önişleminde önemli bir adımdır. Ancak araştırmacının trend döngüsü-mevsimsel ayrışma için bir dizi seçeneği vardır. En yaygın (ampirik literatürdeki atıf sayısına göre değerlendirilir) rakip mevsimsel ayrışma yöntemleri X-11 (12) -ARIMA, Tramo / Koltuklar (her ikisi de Demetra + 'da uygulanır ) ve ' …

4
Uç durumlarda hassaslık ve geri çağırma için doğru değerler nelerdir?
Hassasiyet şu şekilde tanımlanır: p = true positives / (true positives + false positives) Gibi, bu doğru mu true positivesve false positiveshassas 1 yaklaşır yaklaşım 0? Hatırlama için aynı soru: r = true positives / (true positives + false negatives) Şu anda bu değerleri hesaplamam gereken bir istatistiksel test uyguluyorum …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 


2
Bir günlük dönüşümünden sonra standart hatayı hesaplama
Normal olarak dağıtılan rastgele bir sayı kümesi düşünün: x <- rnorm(n=1000, mean=10) Ortalamayı ve ortalamadaki standart hatayı bilmek istiyoruz, böylece aşağıdakileri yapıyoruz: se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units Harika! Bununla birlikte, orijinal dağılımımızın normal bir dağılımı takip ettiğini …

2
Bir günlük dönüşümü, normal olmayan verilerin t testi için geçerli bir teknik midir?
Bir makalenin gözden geçirilmesinde yazarlar, "Normallik için önkoşul varsayımları karşılamak için t testleri yapılmadan önce, eğri dağılım gösteren sürekli sonuç değişkenleri doğal logaritmalar kullanılarak dönüştürülmüştür." Bu normal olmayan verileri analiz etmenin kabul edilebilir bir yolu, özellikle de temeldeki dağıtım mutlaka lognormal değilse? Bu oldukça nadir bir soru olabilir, ama daha …

3
“Normalleştirme” ne demektir ve bir numunenin veya dağılımın normalleştirildiğini nasıl doğrulayabilirim?
Tekdüze dağılımın ( U n i f o r m ( a , b ) olup olmadığını doğrulamak istediğini soran bir sorum varUniform(a,b)Uniform(a,b){\rm Uniform}(a,b) ) normal . Birincisi, herhangi bir dağılımın normalleştirilmesi ne demektir? Ve ikincisi, bir dağılımın normal olup olmadığını nasıl kontrol edeceğiz? X hesaplayarak anlıyorum - meanX−meansdX−meansd \frac{X-\text{mean}}{\text{sd}} …

3
İzometrik log-oran dönüşümü nasıl yapılır
Hareket davranışları (uyku, hareketsiz ve fiziksel aktivite yapmak için harcanan zaman) hakkında yaklaşık 24 (günde saat cinsinden) olan verilerim var. Bu davranışların her birinde harcanan göreceli zamanı yakalayan bir değişken oluşturmak istiyorum - Bana bunu izometrik bir log-oran dönüşümünün başaracağı söylendi. R ilr işlevini kullanmalıyım gibi görünüyor, ancak kod ile …


2
Bir modelin AIC'sini ve log dönüşümlü versiyonunu karşılaştırma
Sorumun özü şudur: Let Y∈RnY∈RnY \in \mathbb{R}^n ortalama bir çok değişkenli normal rastgele değişken olarak μμ\mu ve kovaryans matrisi ΣΣ\Sigma . Let Z:=log(Y)Z:=log⁡(Y)Z := \log(Y) , yani Zi=log(Yi),i∈{1,…,n}Zi=log⁡(Yi),i∈{1,…,n}Z_i = \log(Y_i), i \in \{1,\ldots,n\} . Nasıl bir modelin uygunluğunun AIC gözlenen gerçekleşmelerine kıyasla nasıl bir YYY gözlemlenen gerçekleşmelerine bir model uyum …

4
SVD / PCA için “normalleştirme” değişkenleri
NNN ölçülebilir değişkenimiz olduğunu varsayalım , bir dizi ölçüm yapıyoruz ve sonra noktaları için en yüksek varyansın eksenlerini bulmak için sonuçlarda tekil değer ayrışması yapmak istiyoruz. içerisinde boyutlu alan. ( Not: araçlarının zaten çıkarıldığını varsayalım , bu yüzden tüm için )(a1,a2,…,aN)(a1,a2,…,aN)(a_1, a_2, \ldots, a_N)M>NM>NM > NMMMNNNaiaia_i⟨ai⟩=0⟨ai⟩=0\langle a_i \rangle = 0iii …

2
Regresyon katsayılarının geri dönüşümü
Dönüştürülen bağımlı değişkenle doğrusal bir regresyon yapıyorum. Aşağıdaki dönüşüm, artıkların normallik varsayımının geçerli olacağı şekilde yapılmıştır. Dönüştürülemeyen bağımlı değişken negatif saptandı ve aşağıdaki dönüşüm onu ​​normale yakın hale getirdi: Y=50−Yorig−−−−−−−−√Y=50−YorigY=\sqrt{50-Y_{orig}} burada YorigYorigY_{orig} özgün ölçekte bağımlı değişkendir. Bunun üzerine bazı dönüşümü kullanmak mantıklı düşünmek ββ\beta orijinal ölçeğe yolumuza geri çalışmak için …

2
Temel bileşen analizi yapmadan önce verileri neden log dönüşümü?
Burada bir öğreticiyi takip ediyorum: PCA'yı daha iyi anlamak için http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/ . Eğitici Iris veri kümesini kullanır ve PCA'dan önce bir günlük dönüşümü uygular: [1] ve seti tarafından önerildiği gibi Bildirimi aşağıdaki kodda biz sürekli değişkenler için bir günlük dönüşümü geçerli olduğunu centerve scalehiç eşit TRUEçağrısında prcompönce PCA uygulanmasından değişkenleri …

2
GLM neden dönüştürülmüş değişkenli LM'den farklı?
Bu ders notunda açıklandığı gibi (sayfa 1) , lineer bir model şu şekilde yazılabilir: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, burada cevap değişkendir ve bir x_ {i} olan i ^ {inci} açıklayıcı değişken.yyyxixix_{i}ithithi^{th} Genellikle test varsayımlarını karşılamak amacıyla, yanıt değişkeni dönüştürülebilir. Örneğin, günlük işlevini …

2
GLM'ler için normalleştirici dönüşümün türetilmesi
Üstel aile \newcommand{\E}{\mathbb{E}}için A(⋅)=∫duV1/3(μ)A(⋅)=∫duV1/3(μ)A(\cdot) = \displaystyle\int\frac{du}{V^{1/3}(\mu)} normalleştirme dönüşümü nasıl türetilmişk Daha spesifik olarak : Sayfa 3'teki Taylor genişletme taslağını takip etmeye çalıştım, burada slayt 1, ancak birkaç sorum var. İle XXX bir üstel ailesinden, dönüşüm h(X)h(X)h(X) ve κiκi\kappa _i belirten ithithi^{th} kümülant lamlar iddia: κ3(h(X¯))≈h′(μ)3κ3(X¯)N2+3h′(μ)2h′′(μ)σ4N+O(N−3),κ3(h(X¯))≈h′(μ)3κ3(X¯)N2+3h′(μ)2h″(μ)σ4N+O(N−3), \kappa _3(h(\bar{X})) \approx h'(\mu)^3\frac{\kappa _3(\bar{X})}{N^2} …

4
Verileri dönüştürürken kaçınılması gereken tuzaklar?
Yanıtı iki kez dönüştürdükten sonra XXX ve YYY değişkenim arasında güçlü bir doğrusal ilişki elde ettim . Model Y∼XY∼XY\sim X ama bunu dönüştürülmüş iyileştirilmesi .19 den .76 için. R2YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X}R2R2R^2 Açıkçası bu ilişki üzerinde iyi bir ameliyat yaptım. Aşırı dönüşüm tehlikeleri veya istatistiksel ilkelerin olası ihlalleri gibi bunu yapmanın tuzaklarını …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.