«regression» etiketlenmiş sorular

Bir (veya daha fazla) "bağımlı" değişken ile "bağımsız" değişken arasındaki ilişkiyi analiz etme teknikleri.

1
Bağımsız bir değişkenken oranları dönüştürmenin en uygun yolu nedir?
Bu sorunu anladığımı sanıyordum, ama şimdi tam olarak emin değilim ve devam etmeden önce başkalarıyla görüşmek istiyorum. İki değişkenim var Xve Y. YR, bir orandır ve 0 ve 1 ile sınırlı değildir ve genellikle normal olarak dağıtılır. Xbir orandır ve 0 ve 1 ile sınırlıdır (0,0 ila 0,6 arasında çalışır). …

2
Bayes optimizasyonu için GP regresyonunda koşulsuz kovaryans matrisi
Arka plan ve sorun Regresyon ve sonraki Bayes optimizasyonu (BO) için Gauss İşlemleri'ni (GP) kullanıyorum. Regresyon için, MATLAB için gpml paketini birkaç özel yapım modifikasyonla kullanıyorum, ancak sorun genel. İki eğitim girdisi girdi alanında çok yakın olduğunda, kovaryans matrisinin pozitif olmayan bir kesin hale gelebileceği iyi bilinen bir gerçektir (bu …

1
Beklenen değeri
R 2 a d j u s t e d düzenlemesiyle ilgili olarak bu metnin ilk sayfasının altında yapılan ifadeyi merak ediyorumR2adjustedRadjusted2R^2_\mathrm{adjusted} R2adjusted=1−(1−R2)(n−1n−m−1).Radjusted2=1−(1−R2)(n−1n−m−1).R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right). Metin şunu belirtmektedir: Ayarlamanın mantığı şöyledir: sıradan çoklu regresyonda, rastgele bir tahminci yanıtın varyasyonunun ortalama oranını açıklar , böylece rastgele tahmin ediciler birlikte ortalama olarak yanıtın …

4
Bir problemin doğrusal regresyon için çok uygun olduğuna dair ipuçları
Montgomery, Peck ve Vining'in Doğrusal Regresyon Analizine Giriş'i kullanarak doğrusal regresyon öğreniyorum . Bir veri analizi projesi seçmek istiyorum. Doğrusal regresyonun sadece açıklayıcı değişkenler ile yanıt değişkeni arasında doğrusal fonksiyonel ilişkiler olduğundan şüphelenildiğinde uygun olduğuna dair saf bir düşüncem var. Ancak pek çok gerçek dünya uygulaması bu kriteri karşılamıyor gibi …


3
Muhafaza yöntemi (verileri eğitim ve teste bölme) neden klasik istatistiklerde kullanılmıyor?
Sınıfta veri madenciliğine maruz kalmamda, tutma yöntemi model performansını değerlendirmenin bir yolu olarak tanıtıldı. Ancak, birinci sınıfımı doğrusal modeller üzerine aldığımda, bu model onaylama veya değerlendirme aracı olarak tanıtılmadı. Çevrimiçi araştırmam da herhangi bir kavşak göstermiyor. Muhafaza yöntemi klasik istatistiklerde neden kullanılmıyor?

3
Doğrusal regresyonda kullanılacak Gauss Temeli fonksiyon parametrelerini anlama
Gauss temel işlevini doğrusal regresyon uygulamasına uygulamak istiyorum. Ne yazık ki temel işlevi birkaç parametreleri anlamakta zorlanıyorum. Özellikle ve .σμμ\muσσ\sigma Veri setim 10.000 x 31 bir matristir. 10.000 örnek ve 31 özellik. Ben okudum "Her temel işlevi giriş vektörü x skaler bir değere dönüştürür". Bu yüzden x'in 1 örnek olduğunu …

2
Normal olarak dağılmış X ve Y'nin normal olarak dağılmış artıklara neden olma olasılığı daha yüksektir?
Burada doğrusal regresyonda normallik varsayımının yanlış yorumlanması tartışılmıştır ('normallik' artıklardan ziyade X ve / veya Y'yi ifade eder) ve poster normal olarak dağılmamış X ve Y'ye sahip olmanın mümkün olup olmadığını sorar ve hala normal olarak dağılmış kalıntıları vardır. Benim sorum: normal olarak dağıtılan X ve Y'nin normal olarak dağıtılan …

5
Çok sayıda veri noktasındaki değerlerin gösterimi nasıl yapılır?
Çok büyük bir veri setim var ve yaklaşık% 5 rasgele değerler eksik. Bu değişkenler birbiriyle ilişkilidir. Aşağıdaki örnek R veri kümesi sadece yapay korelasyonlu verilere sahip bir oyuncak örneğidir. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Tahmin aralıklarıyla olasılıksal açıklamalar yapabilir miyiz?
Güven aralıklarının ve tahmin aralıklarının yorumlanması ile ilgili sitede birçok mükemmel tartışmayı okudum, ancak bir kavram hala biraz kafa karıştırıcı: OLS çerçevesini düşünün ve uygun modelini aldık . Bize bir verildi ve yanıtını tahmin etmemiz istendi. değerini hesaplıyoruz ve bir bonus olarak, tahminimiz etrafında% 95 tahmin aralığı sağlıyoruz, a la …


4
Regresyon artık dağılım varsayımları
Dağılım varsayımını hatalara neden koymak gerekir? ϵ i ∼ N ( 0 , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , .ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Neden yazmıyorsun y ı ~ N ( X, β , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , ,yi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) burada her iki durumda da …

1
Lojistik regresyon için şapka matrisinden bilgi
Benim için açık ve birden fazla sitede, şapka matrisinin diyagonalindeki değerlerin doğrusal regresyon için verdiği bilgileri açıklıyor. Lojistik regresyon modelinin şapka matrisi bana daha az açık. Lineer regresyon uygulayarak şapka matrisinden aldığınız bilgilerle aynı mı? Bu, başka bir CV konusunda (kaynak 1) bulduğum şapka matrisinin tanımıdır: H=VX(X′VX)−1X′VH=VX(X′VX)−1X′VH=VX ( X'V X)^-1 …

1
Bağımlı değişkenin bir "kesilmesi" olduğunda modelleme
Kullandığım terminolojilerden herhangi biri yanlışsa önceden özür dileriz. Herhangi bir düzeltmeyi memnuniyetle karşılarım. "Kesim" olarak tanımladığım şey farklı bir isme sahipse, bana bildirin ve soruyu güncelleyebilirim. İlgilendiğim durum şu: bağımsız değişkenleriniz var ve tek bağımlı değişken . Bunu belirsiz bırakacağım, ancak bu değişkenler için iyi bir regresyon modeli almanın nispeten …

5
Özyinelemeli (çevrimiçi) düzenli en küçük kareler algoritması
Birisi beni Tikhonov Düzenlemesi (düzenli en küçük kareler) için çevrimiçi (özyinelemeli) bir algoritma yönünde gösterebilir mi? Çevrimdışı bir ayarda, λ'nın n katlama çapraz doğrulaması kullanılarak bulunduğu orijinal veri β^=(XTX+λI)−1XTYβ^=(XTX+λI)−1XTY\hat\beta=(X^TX+λI)^{−1}X^TY kullanarak \ hat \ beta = (X ^ TX + λI) ^ {- 1} X ^ TY değerini hesaplardım λλλ. Y …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.