«regression» etiketlenmiş sorular

Bir (veya daha fazla) "bağımlı" değişken ile "bağımsız" değişken arasındaki ilişkiyi analiz etme teknikleri.

3
İstatistiksel OLS ve scikit doğrusal regresyon arasındaki fark
Aynı işi yapan farklı kütüphanelerden iki farklı yöntem hakkında bir sorum var. Doğrusal regresyon modeli yapmaya çalışıyorum. OLS ile istatistik modeli kitaplığını kullandığım kod: X_train, X_test, y_train, y_test = cross_validation.train_test_split(x, y, test_size=0.3, random_state=1) x_train = sm.add_constant(X_train) model = sm.OLS(y_train, x_train) results = model.fit() print "GFT + Wiki / GT R-squared", …

2
L2 norm kaybı neden benzersiz bir çözüme sahiptir ve L1 norm kaybı muhtemelen birden fazla çözüme sahiptir?
http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/ Bu yazının üst kısmına bakarsanız, yazar L2 normunun benzersiz bir çözüme sahip olduğunu ve L1 normunun muhtemelen birçok çözüme sahip olduğunu belirtir. Bunu normalleştirme açısından anlıyorum, ancak kayıp fonksiyonunda L1 normunu veya L2 normunu kullanma açısından değil. Skaler x (x ^ 2 ve | x |) işlevlerinin grafiklerine bakarsanız, …

3
Doğrusal regresyonun kantil regresyona göre avantajları nelerdir?
Doğrusal regresyon modeli varsayımları bir demet yapar dilim regresyon doğrusal regresyon varsayımları yerine getirilmesi halinde ve, sonra benim sezgi (ve bazı çok sınırlı deneyimi) medyan regresyon doğrusal regresyon olarak hemen hemen aynı sonuçları vereceğini olduğunu gelmez. Peki, lineer regresyonun ne gibi avantajları vardır? Kesinlikle daha tanıdık, ama bundan başka?

7
Yüzde verilerime ne tür bir eğri (veya model) sığdırmalıyım?
Viral kopyalar ve genom kapsama alanı (GCC) arasındaki ilişkiyi gösteren bir figür oluşturmaya çalışıyorum. Verilerim şöyle görünüyor: İlk başta, doğrusal bir gerileme planladım, ancak amirlerim bunun yanlış olduğunu ve sigmoidal bir eğri denememi söylediler. Bu yüzden geom_smooth kullanarak bunu yaptım: library(scales) ggplot(scatter_plot_new, aes(x = Copies_per_uL, y = Genome_cov, colour = …

1
İki karar ağacının toplamı tek bir karar ağacına eşit mi?
İki regresyon ağaçları (ağaç A ve ağaç B) bu harita giriş olduğunu varsayalım çıkışına . Let ağaç A ve için ağaç B için her bir ağaç ayırma işlevleri gibi hiperdüzlemleri ile, ikili böler kullanır.x ∈ Rdx∈R,dx \in \mathbb{R}^dy^∈ Ry^∈R,\hat{y} \in \mathbb{R}y^= fbir( x )y^=fbir(x)\hat{y} = f_A(x)fB( x )fB(x)f_B(x) Şimdi, ağaç …

5
Bir regresyon modelini iyileştirmek için aykırı değerleri Ortalama Mutlak Hata kutu grafiğine göre düşürmek hile yapıyor mu?
Aşağıdaki kutu grafikte gördüğünüz gibi dört yöntemle test edilmiş bir tahmin modelim var. Modelin öngördüğü özellik 0-8 aralığındadır. Orada olduğunu fark edebilirsiniz biri üst sınır aykırı ve üç alt sınır aykırı tüm yöntemlerle gösterdi. Bu örnekleri verilerden kaldırmanın uygun olup olmadığını merak ediyorum. Yoksa bu tahmin modelini geliştirmek için bir …

1
İki regresyon katsayısının oranının tarafsız bir tahmincisi mi?
Eğer uygun varsayalım doğrusal / lojistik regresyon , tarafsız bir tahmin amacı ile bir 1g(y)=a0+a1⋅x1+a2⋅x2g(y)=a0+a1⋅x1+a2⋅x2g(y) = a_0 + a_1\cdot x_1 + a_2\cdot x_2 . Hem çok eminizbir1vebir2Onların tahminlerine gürültü çok olumlu göredir.a1a2a1a2\frac{a_1}{a_2}a1a1a_1a2a2a_2 Eğer ortak kovaryansını varsa , sen hesaplamak ya da en azından bir cevap etkisi yaratabilir. Daha iyi yollar …

4
Degrade artırıcı makine doğruluğu, yineleme sayısı arttıkça azalır
Gradyan arttırıcı makine algoritmasını caretR'deki paket üzerinden deniyorum. Küçük bir kolej veri kümesi kullanarak, aşağıdaki kodu koştu: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
QR Ayrışmasını Anlama
Daha fazla anlamaya çalıştığım, çalışmış bir örneğim var (R'de). Doğrusal bir model oluşturmak için Limma kullanıyorum ve katlama değişikliği hesaplamalarında adım adım neler olduğunu anlamaya çalışıyorum. Çoğunlukla katsayıları hesaplamak için neler olduğunu anlamaya çalışıyorum. Anlayabildiğim kadarıyla, QR ayrışması katsayıları almak için kullanılır, bu yüzden aslında bir açıklama ya da adım …

1
Doğrusal modeller için BLUE (OLS çözümü) dışındaki diğer tarafsız tahmin ediciler
Doğrusal bir model için OLS çözümü, parametreler için en iyi doğrusal tarafsız tahmin ediciyi sağlar. Tabii ki daha düşük varyans için bir önyargıda işlem yapabiliriz, örneğin sırt regresyonu. Ama sorum önyargısız olmakla ilgili. Biraz yaygın olarak kullanılan, tarafsız ancak OLS tahmini parametrelerinden daha yüksek bir varyansa sahip başka tahminciler var …

2
Önyargı-varyans tradeoff hakkında soru
Önyargı-varyans dengesini, kestiricinin önyargısı ile modelin önyargısı arasındaki ilişkiyi ve kestiricinin varyansı ile modelin varyansı arasındaki ilişkiyi anlamaya çalışıyorum. Bu sonuçlara geldim: Tahmincinin önyargısını ihmal ettiğimizde verileri tersine çevirme eğilimindeyiz, yani sadece modelin varyansını ihmal eden modelin yanlılığını en aza indirmeyi amaçladığımızda tahmin edicinin önyargısı da) Tam tersine, tahmin edicinin …

1
ayarında regresyon : Düzenleme yöntemi nasıl seçilir (Kement, PLS, PCR, sırt)?
Ben gitmek için olup olmadığını görmek çalışıyorum sırt regresyon , kement , temel bileşenler regresyon (PCR) veya Kısmi En Küçük Kareler değişkenler / özellikler (çok sayıda olduğu yerde bir durumda (PLS) ppp ) ve numunelerin daha az sayıda ( ) ve hedefim tahmin.n<pn<pn n , çoğu zaman p>10np>10np>10n ; Değişkenler …


4
Verileri dönüştürürken kaçınılması gereken tuzaklar?
Yanıtı iki kez dönüştürdükten sonra XXX ve YYY değişkenim arasında güçlü bir doğrusal ilişki elde ettim . Model Y∼XY∼XY\sim X ama bunu dönüştürülmüş iyileştirilmesi .19 den .76 için. R2YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X}R2R2R^2 Açıkçası bu ilişki üzerinde iyi bir ameliyat yaptım. Aşırı dönüşüm tehlikeleri veya istatistiksel ilkelerin olası ihlalleri gibi bunu yapmanın tuzaklarını …

4
Dönüştürüldüğünde normal olmayan normal olmayan veriler üzerinde nasıl bir gerileme yapabilirim?
21 ankete Likert ölçeği cevabından elde edilen bazı verilerim (158 vaka) var. Anketteki hangi öğelerin genel bir maddeye (memnuniyet) yanıt verdiğini görmek için gerçekten bir regresyon analizi yapmak istiyorum / ihtiyacım var. Yanıtlar normal olarak dağıtılmaz (KS testlerine göre) ve düşünebildiğim her şekilde (ters, log, log10, sqrt, squared) dönüştürdüm ve …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.