«data-transformation» etiketlenmiş sorular

Veri değerlerinin genellikle doğrusal olmayan matematiksel yeniden ifadesi. Veriler genellikle bir istatistiksel modelin varsayımlarını karşılamak veya bir analizin sonuçlarını daha yorumlanabilir hale getirmek için dönüştürülür.

4
İstatistiklerde Desibel Kullanma
RFID Etiketlerini okuma ve anten yapılandırmasını (anten sayısı, konum, vb.) Değiştirdiğinizde okuyucunun gördüğü sinyal gücünü karşılaştırmayı içeren bir proje üzerinde çalışıyorum. Projenin bir parçası olarak, hangilerinin en etkili olduğunu görmek için kurulumları karşılaştırmam gerekiyor. İdeal olarak, iki anten konumu arasında bir Eşleşmemiş t-Testi veya bir ANOVA (veya çoklu arasında MANOVA) …

2
Bartlett testi vs Levene testi
Şu anda ANOVA varsayımlarına yönelik ihlalleri ele almaya çalışıyorum. Normalliği test etmek için Shapiro-Wilk'ı kullandım ve hem Levene'nin hem de Bartlett'in varyans eşitliği testiyle uğraştım. O zamandan beri log eşit olmayan sapmaları denemek ve düzeltmek için verilerimi dönüştürdü. Bartlett'in log dönüştürülmüş veriler üzerindeki testini yeniden düzenledim ve yine de önemli …

1
Modelin uyumunu dönüştürülmüş ve dönüştürülmemiş yanıtla karşılaştırın
Üç farklı grup arasında orantı veren verileri karşılaştırmak istiyorum, örneğin: ID Group Prop.Nitrogen 1 A 0.89 2 A 0.85 3 B 0.92 4 B 0.97 Wharton ve Hui'nin ardından (doi: 10.1890 / 10-0340.1 1 ) Bu verilerin dönüştürülmüş bir logit kullanımı ile daha iyi ilgilenip ilgilenmeyeceğini anladım. Dönüştürülmüş ve dönüştürülmemiş …

3
P dönüştürmek için bu formüller, bir tam veya şişirilmiş / muhafazakar bir tahmin olarak LS, MSD, SE HSD, Cl,
Arka fon Daha önce yayınlanmış verileri içeren bir meta-analiz yürütüyorum. Genellikle, tedaviler arasındaki farklar P-değerleri, en az anlamlı farklılıklar (LSD) ve diğer istatistikler ile rapor edilir, ancak varyansın doğrudan bir tahmini yoktur. Kullandığım model bağlamında, varyansın fazla tahmin edilmesi doğru. Sorun İşte için dönüşümler listesidir S E = √SESESE (2003 …

3
Basıklığı etkilemeden eğikliği değiştirmek için bir dönüşüm mü?
Basıklığı etkilemeden rastgele bir değişkenin çarpıklığını değiştiren bir dönüşüm olup olmadığını merak ediyorum. Bu, bir RV'nin afin dönüşümünün ortalama ve varyansı nasıl etkilediğine benzer, ancak eğri ve basıklığı değil (kısmen, eğim ve basıklık ölçeğindeki değişikliklere değişmez olarak tanımlandığı için). Bu bilinen bir sorun mu?

1
Geri dönüştürülmüş güven aralıkları
Rastlamak olması bu tartışmanın geri-dönüştürülmüş güven aralıkları sözleşmeler üzerinde soru yükselterek ediyorum. Bu makaleye göre, log-normal rastgele değişkenin ortalaması için geri dönüştürülmüş CI nominal kapsamı: LCL(X)=exp(Y+var(Y) UCL ( X) = exp( Y+ var ( Y)2+ zvar ( Y)n+ var ( Y)22 ( n - 1 )------------√) UCL(X)=exp⁡(Y+var(Y)2+zvar(Y)n+var(Y)22(n−1))\ UCL(X)= \exp\left(Y+\frac{\text{var}(Y)}{2}+z\sqrt{\frac{\text{var}(Y)}{n}+\frac{\text{var}(Y)^2}{2(n-1)}}\right) L …

1
Alışılmadık derecede sınırlı tepki değişkeninin gerilemesi ile başa çıkmak
Teorik olarak -225 ile +225 arasında sınırlı bir yanıt değişkeni modellemeye çalışıyorum. Değişken, deneklerin oyun oynarken aldığı toplam puandır. Teorik olarak konuların +225 puan alması mümkündür. Buna rağmen, puan sadece deneklerin hareketlerine değil, aynı zamanda en fazla puan alan en fazla 125'in olduğu başka bir eylemin eylemlerine de bağlıydı (bu, …


2
Faktörden R = kapalı değişkene dönüştürme sorunu [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Soruyu , Çapraz Doğrulanmış için konuyla ilgili olacak şekilde güncelleyin . 7 yıl önce kapalı . Bir faktör değişkeni sayısal bir dönüştürmek istiyorum ama as.numericbeklediğim bir etkisi yok. Aşağıda, orijinal değişkene dayalı olarak değişkenin …

2
Çok çarpık, sayım verilerinin kümelenmesi: devam etmek için herhangi bir öneri (dönüşüm vb.)?
Temel problem İşte benim temel sorun: Sayıları ile çok çarpık bazı değişkenler içeren bir veri kümesini kümelenmeye çalışıyorum. Değişkenler çok sayıda sıfır içerir ve bu nedenle kümeleme prosedürüm için çok bilgilendirici değildir - k-ortalama algoritması olması muhtemeldir. Güzel, sadece değişkenleri kare kök, kutu cox veya logaritma kullanarak dönüştürün. Ancak değişkenlerim …

4
Ana ilgi alanı olmayan tüm değişkenleri neden log-dönüştürmüyoruz?
Kitaplar ve tartışmalar sık ​​sık bir yordayıcıyla (birkaçının olduğu) sorunlarla karşılaştığında, log-dönüşümünün bir olasılık olduğunu belirtir. Şimdi, bunun öngörücülerdeki dağılımlara ve normalliğe bağlı olduğunu anlıyorum, bir gerileme varsayımı değildir; ancak günlük dönüştürme, verileri daha düzenli hale getirir, aykırı değerlerden daha az etkilenir vb. Ana interesr olmayan tüm sürekli değişkenlerimi, yani …

2
Ters bağımsız değişkenli regresyon
Diyelim ki bağımlı değişkenlerin vektörü ve bağımsız değişkenin vektör . Zaman karşı çizilir , ikisi arasında doğrusal bir ilişki (yukarı doğru bir eğilim) olduğunu görüyoruz. Şimdi, bu aynı zamanda ve arasında doğrusal bir düşüş eğilimi olduğu anlamına gelir .X Y 1NN-NHYYYNN-NXXXYYY YX1X1X\frac{1}{X}YYYXXX Şimdi, regresyonu çalıştırırsam: ve uygun değeriY = β …

3
Amerikan Topluluğu Araştırması çeşitlilik verilerinin yeniden ağırlıklandırılması, hata paylarını nasıl etkiler?
Arka plan: Kuruluşum şu anda işgücü çeşitliliği istatistiklerini (örn.% Engelli kişiler,% kadın, gazi yüzdesi) Amerikan Topluluğu Araştırması'na (ABD Nüfus Sayım Bürosu tarafından yürütülen bir anket projesi) dayanan bu grupların toplam işgücü mevcudiyeti ile karşılaştırmaktadır. Bu yanlış bir ölçüttür, çünkü bir bütün olarak işgücünden farklı demografik özelliklere sahip çok özel bir …

1
ARIMA modelimdeki gözlem 48'e yenilikçi bir aykırı değeri nasıl dahil edebilirim?
Bir veri kümesi üzerinde çalışıyorum. Bazı model tanımlama tekniklerini kullandıktan sonra bir ARIMA (0,2,1) modeliyle çıktım. Orijinal veri setimin 48. gözleminde yenilikçi bir aykırı değer (IO) tespit etmek için R'deki detectIOpaketteki işlevi kullandım .TSA Öngörme amacıyla kullanabilmem için bu aykırı değeri modelime nasıl dahil edebilirim? ARIMAX modelini kullanmak istemiyorum çünkü …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
Bağımlı değişkenimi dönüştürdüğümde log tuttum, LOG link fonksiyonu ile GLM normal dağılımını kullanabilir miyim?
Genelleştirilmiş Doğrusal Modeller (GLM) ile ilgili bir sorum var. Bağımlı değişkenim (DV) sürekli ve normal değil. Bu yüzden log dönüştürdüm (hala normal değil ama geliştirdim). DV'yi iki kategorik değişken ve bir sürekli değişkenle ilişkilendirmek istiyorum. Bunun için bir GLM yapmak istiyorum (SPSS kullanıyorum), ancak dağıtım ve seçim işlevine nasıl karar …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.