İstatistikler ve Büyük Veri data-transformation

2

Doğrusallığa ulaşmak için en iyi dönüşüm nasıl seçilir?

Çoklu doğrusal regresyon yapmak ve sonra yeni değerleri az tahmin ile tahmin etmek istiyorum. Yanıt değişkenim -2 ile +7 arasında ve üç öngörücü var (yaklaşık +10 - +200 aralığında). Dağılım neredeyse normaldir. Ancak cevap ve öngörücüler arasındaki ilişki doğrusal değildir, araziler üzerinde eğriler görüyorum. Örneğin bunun gibi: http://cs10418.userapi.com/u17020874/153949434/x_9898cf38.jpg Doğrusallığa ulaşmak …

10 regression data-transformation

3

Doğrusal model Değişen varyans

Aşağıdaki doğrusal model var: Kalıntıların heterosensedastisitesini ele almak için bağımlı değişkene bir log dönüşümü olarak uygulamaya çalıştım fakat artıklar üzerinde aynı fan çıkışı etkisini görüyorum. DV değerleri nispeten küçüktür, bu nedenle günlüğü almadan önce +1 sabit ilavesi bu durumda muhtemelen uygun değildir.log(Y+1)log⁡(Y+1)\log(Y + 1) > summary(Y) Min. :-0.0005647 1st Qu.: …

10 regression data-transformation linear-model heteroscedasticity

4

Doğrusal regresyonda logaritmik olarak dönüştürülmüş katsayılar nasıl yorumlanır?

Benim durumum: Basit doğrusal regresyon için artıklarını normalleştirmek üzere logaritmik olarak dönüştürdüğüm 1 sürekli bağımlı ve 1 sürekli yordayıcı değişkenim var. Bu dönüştürülmüş değişkenleri orijinal bağlamlarıyla nasıl ilişkilendirebileceğim konusunda her türlü yardımı takdir ediyorum. 2011'de kaçırdıkları gün sayısına göre 2011'de öğrencilerin okula gitmedikleri gün sayısını tahmin etmek için doğrusal bir …

10 regression data-transformation regression-coefficients logarithm

1

Çoklu regresyon yaparken tahmin değişkenleri ne zaman dönüştürülmelidir?

Şu anda lisansüstü düzeyde ilk uygulamalı doğrusal regresyon dersimi alıyorum ve çoklu doğrusal regresyonda öngörücü değişken dönüşümleri ile mücadele ediyorum. Kullandığım metin, Kutner ve ark. "Uygulamalı Doğrusal İstatistiksel Modeller" yaşadığım soruyu kapsamıyor gibi görünüyor. (çoklu öngörücülerin dönüştürülmesi için bir Box-Cox yöntemi olduğunu öne sürmek dışında). Bir cevap değişkeni ve birkaç …

10 data-transformation multiple-regression

2

CSV sütunlarını kategorik veri olarak doğrudan okumak mümkün müdür?

CSV ile gelen bir tıbbi anketten (100+ kodlu sütunlarla) verileri R ile analiz etmem gerekiyor. İlk analiz için çıngırak kullanacağım ama perde arkasında hala R var. I Eğer read.csv () dosyası, sayısal kodların kolonların sayısal veri olarak kabul edilir. Onlardan faktör () ile kategorik sütunlar oluşturabileceğimin farkındayım, ancak 100+ sütun …

10 r categorical-data data-transformation

5

Karekök, kütük vs. gibi yaygın olanların ötesinde başka hangi normalleştirici dönüşümler yaygın olarak kullanılır?

Test puanlarının analizinde (örneğin Eğitim veya Psikoloji), ortak analiz teknikleri genellikle verilerin normal olarak dağıtıldığını varsayar. Bununla birlikte, belki de çoğu zaman, puanlar bazen çılgınca normalden sapma eğilimindedir. Bazı temel normalleştirici dönüşümlere aşinayım: kare kökler, logaritmalar, pozitif eğriltmeyi azaltmak için karşılıklı dönüşümler, negatif eğriliği azaltmak için yukarıdakilerin yansıtılmış versiyonları, leptokurtik …

10 data-transformation normality-assumption variance-stabilizing

1

Neden kullanamıyoruz

Bağımlı değişken ile doğrusal bir regresyon modelimiz olduğunu düşünün . Biz onun bulmak . Şimdi, başka bir gerileme yapıyoruz, ancak bu sefer ve benzer şekilde buluyoruz . Hangi modelin daha uygun olduğunu görmek için her iki karşılaştıramayacağım söylendi . Neden? Bana verilen neden, farklı miktarların (farklı bağımlı değişkenler) değişkenliğini karşılaştırmamızdır. …

10 regression data-transformation r-squared

2

Poisson dağılımını normal dağılıma dönüştürme

Öncelikle bir bilgisayar bilimi geçmişim var ama şimdi kendime temel istatistikleri öğretmeye çalışıyorum. Poisson dağılımı olduğunu düşündüğüm bazı verilerim var İki sorum var: Bu bir Poisson dağılımı mı? İkincisi, bunu normal bir dağılıma dönüştürmek mümkün mü? Herhangi bir yardım mutluluk duyacağız. Çok teşekkürler

10 normal-distribution data-transformation poisson-distribution

1

Bir zaman serisinin karesi sabitse, orijinal zaman serisi sabit midir?

Bir zaman serisinin karesi sabitse, orijinal zaman serisinin de tersi olduğunu belirten bir çözüm buldum. Ancak bunu kanıtlayamıyorum, bunun doğru olup olmadığı ve nasıl türetileceği konusunda kimsenin bir fikri var mı?

9 time-series self-study data-transformation stationarity

2

Sipariş İstatistiklerini Dönüştürme

Rastgele değişkenler varsayalım X1,...,XnX1,...,XnX_1, ... , X_nve bağımsızdır ve dağıtılır. Bu ABS , bir sahiptir dağılımı.Y1,...,YnY1,...,YnY_1, ..., Y_nU(0,a)U(0,a)U(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Zn=nlog⁡max(Y(n),X(n))min(Y(n),X(n))Z_n= n\log\frac{\max(Y_{(n)},X_{(n)})}{\min(Y_{(n)},X_{(n)})}Exp(1)Exp(1)\text{Exp}(1) Ben ayarı bu sorunu başladım Sonra olarak dağıtılacak ve olarak dağıtılacak Yoğunluklar olarak kolayca bulunabilir ve{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}\{X_1,...,X_n,Y_1,...Y_n\} = \{Z_1,...,Z_n\}max(Yn,Xn)=Z(2n)max(Yn,Xn)=Z(2n)\max(Y_n,X_n)= Z_{(2n)}(za)2n(za)2n(\frac{z}{a})^{2n}min(Yn,Xn)=Z(1)min(Yn,Xn)=Z(1)\min(Y_n,X_n)= Z_{(1)}1−(1−za)2n1−(1−za)2n1 - (1 - \frac{z}{a})^{2n}fZ1( z) = ( 2 n ) ( …

9 self-study data-transformation order-statistics

2

Regresyon sonuçlarında beklenmeyen üst sınır var

Bir denge skoru tahmin etmeye çalıştım ve birkaç farklı regresyon yöntemini denedim. Fark ettiğim bir şey, tahmin edilen değerlerin bir çeşit üst sınıra sahip olduğu görünüyor. Yani, gerçek denge , ancak tahminlerim yaklaşık . Aşağıdaki grafik, gerçek ile tahmin edilen dengeyi göstermektedir (doğrusal regresyon ile tahmin edilir):[ 0.0 , 1.0 …

9 regression distributions data-transformation prediction bounds

1

LDA'yı ön işleme adımı olarak kullanırken özellikleri standartlaştırma

Boyutsallık azalması (veya PCA yoluyla boyutsallık azalmasından sonra dönüşüm) için çok sınıflı bir Lineer Diskriminant Analizi (veya bazen Birden Çok Diskriminant Analizi de okurum) kullanılıyorsa, genel olarak bir "Z skoru normalizasyonu" (veya standardizasyonu) özellikler tamamen farklı ölçeklerde ölçülseler bile gerekli değil mi? LDA, halihazırda normalleştirilmiş Öklid mesafelerini ima eden Mahalanobis …

9 classification data-transformation normalization standardization discriminant-analysis

2

Önceki tüm çabalara meydan okuyan bu doğrusal olmayan çoklu regresyona uymama yardım et

EDIT: Bu yazı yaptığımdan beri, burada ek bir yazı ile takip ettim . Aşağıdaki metnin özeti: Bir model üzerinde çalışıyorum ve doğrusal regresyon, Box Cox dönüşümleri ve GAM'ı denedim, ancak fazla ilerleme kaydetmedim Kullanarak R, şu anda büyük lig (MLB) düzeyinde küçük lig beyzbol oyuncularının başarısını tahmin etmek için bir …

9 r multiple-regression data-transformation nonlinear-regression gam

1

Bir istatistiğin dağılımını bulma

Bir test için çalışıyorum. Buna cevap veremedim. İzin Vermek X1,i,X2,i,X3,i,i=1,…,nX1,i,X2,i,X3,i,i=1,…,nX_{1,i},X_{2,i},X_{3,i}, i=1,\ldots,n ol N(0,1)N(0,1)\mathcal{N}(0,1)rastgele değişkenler. Tanımlamak Wi=(X1,i+X2,iX3,i)/1+X23,i−−−−−−−√,i=1,…,nWi=(X1,i+X2,iX3,i)/1+X3,i2,i=1,…,nW_i = (X_{1,i} + X_{2,i}X_{3,i})/\sqrt{1 + X_{3,i}^2}, i = 1, \ldots, n, ve W¯¯¯¯¯n=n−1∑ni=1WiW¯n=n−1∑i=1nWi\overline{W}_n = n^{-1}\sum_{i=1}^nW_i, S2n=(n−1)−1∑ni=1(Wi−W¯¯¯¯¯n)2,n≥2.Sn2=(n−1)−1∑i=1n(Wi−W¯n)2,n≥2.S_n^2 = (n-1)^{-1}\sum_{i=1}^n(W_i - \overline{W}_n)^2, n \ge 2. Dağılımı nedir W¯¯¯¯¯nW¯n\overline{W}_n, S2nSn2S_n^2? Böyle bir soruna başlarken kullanılacak en iyi …

9 normal-distribution data-transformation

4

Box Cox Regresyon için Dönüşümler

Sadece bir öngörücü (örneğin (x, y)) ile bazı verilere doğrusal bir model sığdırmaya çalışıyorum. Veriler, küçük x değerleri için, y değerlerinin düz bir çizgiye sıkıca oturduğu, ancak x değerleri arttıkça y değerlerinin daha uçucu hale geleceği şekildedir. İşte bu tür verilere bir örnek (R kodu) y = c(3.2,3.4,3.5,3.8,4.2,5.5,4.5,6.8,7.4,5.9) x = …

9 r regression variance data-transformation

«data-transformation» etiketlenmiş sorular