«residuals» etiketlenmiş sorular

Bir modelin kalıntıları, tahmin edilen değerlerden eksi olan gerçek değerlerdir. Birçok istatistiksel model, artıklar tarafından tahmin edilen hata hakkında varsayımlar yapar.

2
Lojistik regresyon modellerinin değerlendirilmesi
Bu soru, bir lojistik modelin yeterince iyi olup olmadığına nasıl karar verileceğime dair gerçek karışıklığımdan kaynaklanıyor. Bağımlı bir değişken olarak oluşturulduktan iki yıl sonra bireysel projenin durumunu kullanan modellerim var. Sonuç başarılı (1) ya da değil (0). Çiftlerin oluşumu sırasında ölçülen bağımsız değişkenlerim var. Amacım, varsaydığım bir değişkenin çiftlerin başarısını …

2
GLM ailesi cevap değişkeninin veya artıkların dağılımını temsil eder mi?
Bunun hakkında birkaç laboratuvar üyesi ile tartışıyordum ve birkaç kaynağa gittik, ancak yine de tam olarak cevabımız yok: Bir GLM'nin bir poisson ailesine sahip olduğunu söylediğimizde, diyelim ki artıkların dağılımı veya cevap değişkeni hakkında mı konuşalım? Çekişme noktaları Okuma bu o GLM varsayımlar gözlemlerin istatistiksel bağımsızlık, olduğunu bildiren makale bağlantı …

1
GBM kullanarak GBM paketi ve Caret
Model kullanarak ayar yapıyordum caret, ancak gbmpaketi kullanarak modeli yeniden çalıştırıyorum . Anladığım kadarıyla caretpaketin kullandığı gbmve çıktı aynı olmalı. Bununla birlikte, sadece hızlı bir test çalıştırması data(iris), değerlendirme metriği olarak RMSE ve R ^ 2 kullanılarak modelde yaklaşık% 5 tutarsızlık gösterir. Kısmi bağımlılık grafiklerini kullanmak için en iyi model …

3
Gecikmeli bağımlı değişkene karşı artık otokorelasyon
Zaman serisinin modellenmesi sırasında, örneğin bir AR (1) işlemi (2) açıklayıcı değişken olarak gecikmeli bağımlı değişkeni (sağ tarafta) içerdiğinden (1) hata terimlerinin korelasyon yapısını modelleme olanağına sahiptir. Anlamak istiyorum, bazen gitmek için önemli nedenler (2). Ancak, (1) veya (2) veya her ikisini birden yapmanın metodolojik nedenleri nelerdir?

2
Normal olarak dağılmış X ve Y'nin normal olarak dağılmış artıklara neden olma olasılığı daha yüksektir?
Burada doğrusal regresyonda normallik varsayımının yanlış yorumlanması tartışılmıştır ('normallik' artıklardan ziyade X ve / veya Y'yi ifade eder) ve poster normal olarak dağılmamış X ve Y'ye sahip olmanın mümkün olup olmadığını sorar ve hala normal olarak dağılmış kalıntıları vardır. Benim sorum: normal olarak dağıtılan X ve Y'nin normal olarak dağıtılan …

5
Çok sayıda veri noktasındaki değerlerin gösterimi nasıl yapılır?
Çok büyük bir veri setim var ve yaklaşık% 5 rasgele değerler eksik. Bu değişkenler birbiriyle ilişkilidir. Aşağıdaki örnek R veri kümesi sadece yapay korelasyonlu verilere sahip bir oyuncak örneğidir. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

4
Regresyon artık dağılım varsayımları
Dağılım varsayımını hatalara neden koymak gerekir? ϵ i ∼ N ( 0 , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , .ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Neden yazmıyorsun y ı ~ N ( X, β , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , ,yi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) burada her iki durumda da …

2
Neden bazı insanlar ham verileri üzerinde regresyon benzeri model varsayımlarını test ederken, diğer insanlar bunları artık üzerinde test ediyor?
Deneysel psikoloji doktora öğrencisiyim ve verilerimi nasıl analiz edeceğime ilişkin bilgi ve becerilerimi geliştirmek için çok uğraşıyorum. Psikoloji'deki 5. yılıma kadar, regresyon benzeri modellerin (örneğin, ANOVA) aşağıdakileri varsaydığını düşündüm: verilerin normalliği veriler için varyans homojenliği vb. Lisans derslerim, varsayımların verilerle ilgili olduğuna inanmamı sağlıyor. Ancak 5. sınıfımda bazı eğitmenlerim varsayımların …


2
Lojistik regresyon kalıntı analizi
Bu soru biraz genel ve uzun soluklu, ama lütfen bana katlan. Uygulamamda, her biri ~ 50 özellikli ~ 20.000 veri noktasından ve tek bir bağımlı ikili değişkenten oluşan birçok veri setim var. Veri kümelerini düzenli lojistik regresyon (R paket glmnet ) kullanarak modellemeye çalışıyorum Analizimin bir parçası olarak, aşağıdaki gibi …

1
Fisher Kesin Testi ve Hipergeometrik Dağılım
Balıkçı testini daha iyi anlamak istedim, bu yüzden f ve m erkek ve kadına karşılık gelen ve n ve y "soda tüketimine" karşılık gelen aşağıdaki oyuncak örneğini tasarladım: > soda_gender f m n 0 5 y 5 0 Açıkçası, bu büyük bir basitleştirme, ama bağlamın önüne geçmesini istemedim. Burada sadece …

1
Teşhis neden artıklara dayanıyor?
Basit doğrusal regresyonda, genellikle çıkarım yapabilmek için belirli varsayımların karşılanıp karşılanmadığını doğrulamak ister (örn. Artıklar normal olarak dağıtılır). Takılan değerlerin normal olarak dağıtılıp dağıtılmadığını kontrol ederek varsayımları kontrol etmek makul müdür?

2
Değişen değişkenlik ve artıklar normallik
Oldukça iyi olan doğrusal bir regresyonum var, sanırım (bir üniversite projesi için, bu yüzden gerçekten doğru olmak zorunda değilim). Mesele şu ki, artıkları tahmin edilen değerlere karşı çizersem, (öğretmenime göre) bir heteroskedastisite ipucu var. Ancak artıkların QQ-Grafiğini çizersem, normal olarak dağıldıkları açıktır. Üstelik artıklar üzerinde Shapiro testi vardır ait -Değer …

2
Artıkların bir grafikten otokorelasyonu olup olmadığı nasıl anlaşılır
Bir OLS regresyonu yapıp ortaya çıkan kalıntıları çizdiğinizde, kalıntıların otokorelasyonu olup olmadığını nasıl anlarsınız? Bunun için testler olduğunu biliyorum (Durbin, Breusch-Godfrey), ancak otokorelasyonun bir sorun olup olmadığını ölçmek için bir arsaya bakıp bakamayacağınızı merak ediyordum (çünkü heteroskedastisite için bunu yapmak oldukça kolaydır).

2
R'de çoklu doğrusal regresyonun takılması: otokorelasyonlu artıklar
Böyle bir denklem ile R çoklu doğrusal regresyon tahmin etmeye çalışıyorum: regr <- lm(rate ~ constant + askings + questions + 0) sorular ve sorular üçer aylık dönemler arası veri serileri ile oluşturulmuştur askings <- ts(...). Sorun şu ki, otokorelasyonlu kalıntılar var. Gls işlevini kullanarak regresyona uymanın mümkün olduğunu biliyorum, …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.