«data-transformation» etiketlenmiş sorular

Veri değerlerinin genellikle doğrusal olmayan matematiksel yeniden ifadesi. Veriler genellikle bir istatistiksel modelin varsayımlarını karşılamak veya bir analizin sonuçlarını daha yorumlanabilir hale getirmek için dönüştürülür.

2
Doğrusallığa ulaşmak için en iyi dönüşüm nasıl seçilir?
Çoklu doğrusal regresyon yapmak ve sonra yeni değerleri az tahmin ile tahmin etmek istiyorum. Yanıt değişkenim -2 ile +7 arasında ve üç öngörücü var (yaklaşık +10 - +200 aralığında). Dağılım neredeyse normaldir. Ancak cevap ve öngörücüler arasındaki ilişki doğrusal değildir, araziler üzerinde eğriler görüyorum. Örneğin bunun gibi: http://cs10418.userapi.com/u17020874/153949434/x_9898cf38.jpg Doğrusallığa ulaşmak …

3
Doğrusal model Değişen varyans
Aşağıdaki doğrusal model var: Kalıntıların heterosensedastisitesini ele almak için bağımlı değişkene bir log dönüşümü olarak uygulamaya çalıştım fakat artıklar üzerinde aynı fan çıkışı etkisini görüyorum. DV değerleri nispeten küçüktür, bu nedenle günlüğü almadan önce +1 sabit ilavesi bu durumda muhtemelen uygun değildir.log(Y+1)log⁡(Y+1)\log(Y + 1) > summary(Y) Min. :-0.0005647 1st Qu.: …

4
Doğrusal regresyonda logaritmik olarak dönüştürülmüş katsayılar nasıl yorumlanır?
Benim durumum: Basit doğrusal regresyon için artıklarını normalleştirmek üzere logaritmik olarak dönüştürdüğüm 1 sürekli bağımlı ve 1 sürekli yordayıcı değişkenim var. Bu dönüştürülmüş değişkenleri orijinal bağlamlarıyla nasıl ilişkilendirebileceğim konusunda her türlü yardımı takdir ediyorum. 2011'de kaçırdıkları gün sayısına göre 2011'de öğrencilerin okula gitmedikleri gün sayısını tahmin etmek için doğrusal bir …

1
Çoklu regresyon yaparken tahmin değişkenleri ne zaman dönüştürülmelidir?
Şu anda lisansüstü düzeyde ilk uygulamalı doğrusal regresyon dersimi alıyorum ve çoklu doğrusal regresyonda öngörücü değişken dönüşümleri ile mücadele ediyorum. Kullandığım metin, Kutner ve ark. "Uygulamalı Doğrusal İstatistiksel Modeller" yaşadığım soruyu kapsamıyor gibi görünüyor. (çoklu öngörücülerin dönüştürülmesi için bir Box-Cox yöntemi olduğunu öne sürmek dışında). Bir cevap değişkeni ve birkaç …

2
CSV sütunlarını kategorik veri olarak doğrudan okumak mümkün müdür?
CSV ile gelen bir tıbbi anketten (100+ kodlu sütunlarla) verileri R ile analiz etmem gerekiyor. İlk analiz için çıngırak kullanacağım ama perde arkasında hala R var. I Eğer read.csv () dosyası, sayısal kodların kolonların sayısal veri olarak kabul edilir. Onlardan faktör () ile kategorik sütunlar oluşturabileceğimin farkındayım, ancak 100+ sütun …

5
Karekök, kütük vs. gibi yaygın olanların ötesinde başka hangi normalleştirici dönüşümler yaygın olarak kullanılır?
Test puanlarının analizinde (örneğin Eğitim veya Psikoloji), ortak analiz teknikleri genellikle verilerin normal olarak dağıtıldığını varsayar. Bununla birlikte, belki de çoğu zaman, puanlar bazen çılgınca normalden sapma eğilimindedir. Bazı temel normalleştirici dönüşümlere aşinayım: kare kökler, logaritmalar, pozitif eğriltmeyi azaltmak için karşılıklı dönüşümler, negatif eğriliği azaltmak için yukarıdakilerin yansıtılmış versiyonları, leptokurtik …

1
Neden kullanamıyoruz
Bağımlı değişken ile doğrusal bir regresyon modelimiz olduğunu düşünün . Biz onun bulmak . Şimdi, başka bir gerileme yapıyoruz, ancak bu sefer ve benzer şekilde buluyoruz . Hangi modelin daha uygun olduğunu görmek için her iki karşılaştıramayacağım söylendi . Neden? Bana verilen neden, farklı miktarların (farklı bağımlı değişkenler) değişkenliğini karşılaştırmamızdır. …



2
Sipariş İstatistiklerini Dönüştürme
Rastgele değişkenler varsayalım X1,...,XnX1,...,XnX_1, ... , X_nve bağımsızdır ve dağıtılır. Bu ABS , bir sahiptir dağılımı.Y1,...,YnY1,...,YnY_1, ..., Y_nU(0,a)U(0,a)U(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Zn=nlog⁡max(Y(n),X(n))min(Y(n),X(n))Z_n= n\log\frac{\max(Y_{(n)},X_{(n)})}{\min(Y_{(n)},X_{(n)})}Exp(1)Exp(1)\text{Exp}(1) Ben ayarı bu sorunu başladım Sonra olarak dağıtılacak ve olarak dağıtılacak Yoğunluklar olarak kolayca bulunabilir ve{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}\{X_1,...,X_n,Y_1,...Y_n\} = \{Z_1,...,Z_n\}max(Yn,Xn)=Z(2n)max(Yn,Xn)=Z(2n)\max(Y_n,X_n)= Z_{(2n)}(za)2n(za)2n(\frac{z}{a})^{2n}min(Yn,Xn)=Z(1)min(Yn,Xn)=Z(1)\min(Y_n,X_n)= Z_{(1)}1−(1−za)2n1−(1−za)2n1 - (1 - \frac{z}{a})^{2n}fZ1( z) = ( 2 n ) ( …

2
Regresyon sonuçlarında beklenmeyen üst sınır var
Bir denge skoru tahmin etmeye çalıştım ve birkaç farklı regresyon yöntemini denedim. Fark ettiğim bir şey, tahmin edilen değerlerin bir çeşit üst sınıra sahip olduğu görünüyor. Yani, gerçek denge , ancak tahminlerim yaklaşık . Aşağıdaki grafik, gerçek ile tahmin edilen dengeyi göstermektedir (doğrusal regresyon ile tahmin edilir):[ 0.0 , 1.0 …

1
LDA'yı ön işleme adımı olarak kullanırken özellikleri standartlaştırma
Boyutsallık azalması (veya PCA yoluyla boyutsallık azalmasından sonra dönüşüm) için çok sınıflı bir Lineer Diskriminant Analizi (veya bazen Birden Çok Diskriminant Analizi de okurum) kullanılıyorsa, genel olarak bir "Z skoru normalizasyonu" (veya standardizasyonu) özellikler tamamen farklı ölçeklerde ölçülseler bile gerekli değil mi? LDA, halihazırda normalleştirilmiş Öklid mesafelerini ima eden Mahalanobis …

2
Önceki tüm çabalara meydan okuyan bu doğrusal olmayan çoklu regresyona uymama yardım et
EDIT: Bu yazı yaptığımdan beri, burada ek bir yazı ile takip ettim . Aşağıdaki metnin özeti: Bir model üzerinde çalışıyorum ve doğrusal regresyon, Box Cox dönüşümleri ve GAM'ı denedim, ancak fazla ilerleme kaydetmedim Kullanarak R, şu anda büyük lig (MLB) düzeyinde küçük lig beyzbol oyuncularının başarısını tahmin etmek için bir …

1
Bir istatistiğin dağılımını bulma
Bir test için çalışıyorum. Buna cevap veremedim. İzin Vermek X1,i,X2,i,X3,i,i=1,…,nX1,i,X2,i,X3,i,i=1,…,nX_{1,i},X_{2,i},X_{3,i}, i=1,\ldots,n ol N(0,1)N(0,1)\mathcal{N}(0,1)rastgele değişkenler. Tanımlamak Wi=(X1,i+X2,iX3,i)/1+X23,i−−−−−−−√,i=1,…,nWi=(X1,i+X2,iX3,i)/1+X3,i2,i=1,…,nW_i = (X_{1,i} + X_{2,i}X_{3,i})/\sqrt{1 + X_{3,i}^2}, i = 1, \ldots, n, ve W¯¯¯¯¯n=n−1∑ni=1WiW¯n=n−1∑i=1nWi\overline{W}_n = n^{-1}\sum_{i=1}^nW_i, S2n=(n−1)−1∑ni=1(Wi−W¯¯¯¯¯n)2,n≥2.Sn2=(n−1)−1∑i=1n(Wi−W¯n)2,n≥2.S_n^2 = (n-1)^{-1}\sum_{i=1}^n(W_i - \overline{W}_n)^2, n \ge 2. Dağılımı nedir W¯¯¯¯¯nW¯n\overline{W}_n, S2nSn2S_n^2? Böyle bir soruna başlarken kullanılacak en iyi …

4
Box Cox Regresyon için Dönüşümler
Sadece bir öngörücü (örneğin (x, y)) ile bazı verilere doğrusal bir model sığdırmaya çalışıyorum. Veriler, küçük x değerleri için, y değerlerinin düz bir çizgiye sıkıca oturduğu, ancak x değerleri arttıkça y değerlerinin daha uçucu hale geleceği şekildedir. İşte bu tür verilere bir örnek (R kodu) y = c(3.2,3.4,3.5,3.8,4.2,5.5,4.5,6.8,7.4,5.9) x = …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.