«model-selection» etiketlenmiş sorular

Model seçimi, bazı setlerden hangi modelin en iyi performansı gösterdiğine karar verme problemidir. Popüler yöntemler şunları içerir:R,2, AIC ve BIC ölçütleri, test setleri ve çapraz doğrulama. Bir dereceye kadar, özellik seçimi, model seçiminin bir alt problemidir.


3
ACF ve PACF grafiklerini analiz edin
ACF ve PACF arazilerimin analizinde doğru yolda olup olmadığımı görmek istiyorum: Arkaplan: (Reff: Philip Hans Franses, 1998) Hem ACF hem de PACF önemli değerler gösterdiğinden, ARMA modelinin ihtiyaçlarıma cevap vereceğini düşünüyorum. ACF, MA parçasını tahmin etmek için kullanılabilir, yani q değeri, PACF, AR parçasını, yani p değerini tahmin etmek için …

1
Firth lojistik regresyon ile model seçimi
Çalıştığım küçük bir veri setinde ( ) birkaç değişken bana mükemmel bir öngörü / ayrılık verir . Bu yüzden , konuyla ilgilenmek için Firth lojistik regresyon kullanıyorum .n ∼ 100n~100n\sim100 En iyi modeli AIC veya BIC ile seçersem , bu bilgi kriterlerini hesaplarken olasılığa Firth cezasını da dahil etmeli miyim?

2
Model seçiminden sonra Çapraz Doğrulama (hata genellemesi)
Not: Dava n >> p İstatistiksel Öğrenme Öğelerini okuyorum ve çapraz doğrulama yapmanın "doğru" yoluyla ilgili çeşitli görüşler var (örneğin sayfa 60, sayfa 245). Spesifik olarak sorum, son modelin (ayrı bir test seti olmadan) k-fold CV kullanarak veya bir model araması yapıldığında önyükleme kullanarak nasıl değerlendirileceğidir? Çoğu durumda (gömülü özellik …

4
PCA alanına yeni bir vektör nasıl yansıtılır?
Temel bileşen analizi (PCA) yaptıktan sonra, PCA alanına yeni bir vektör yansıtmak istiyorum (yani PCA koordinat sistemindeki koordinatlarını bulmak). PCA'yı R dilinde kullanarak hesapladım prcomp. Şimdi vektörümü PCA dönme matrisi ile çarpabilmeliyim. Bu matristeki temel bileşenler satır veya sütunlar halinde mi düzenlenmelidir?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

6
Bir regresyon modelinden ne zaman terim bırakılır?
Aşağıdakilerin anlamlı olup olmadığı konusunda herkes tavsiyede bulunabilir mi? 4 öngörücülü sıradan bir doğrusal model ile uğraşıyorum. En az önemli terimi bırakıp bırakmamam iki aklımdayım. It adlı -değeri 0.05 biraz fazla olduğunu. Bu satırlar boyunca bırakmayı tercih ettim: Bu terimin tahmininin (örneğin) bu değişken için örnek verilerinin çeyrekler arası aralığı …

4
Uç durumlarda hassaslık ve geri çağırma için doğru değerler nelerdir?
Hassasiyet şu şekilde tanımlanır: p = true positives / (true positives + false positives) Gibi, bu doğru mu true positivesve false positiveshassas 1 yaklaşır yaklaşım 0? Hatırlama için aynı soru: r = true positives / (true positives + false negatives) Şu anda bu değerleri hesaplamam gereken bir istatistiksel test uyguluyorum …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
Tahminleme ile değil, yalnızca modelleme ile ilgilenirsek, düzenlileştirme yardımcı olabilir mi?
Tahmin veya tahminle değil, yalnızca model parametrelerini tahmin etmek (ve yorumlamak) ile ilgileniyorsak, düzenlileştirme yardımcı olabilir mi? Amacınız yeni veriler üzerinde iyi tahminler yapmaksa, normalleştirme / çapraz doğrulamanın son derece yararlı olduğunu görüyorum. Peki ya geleneksel ekonomi yapıyorsanız ve tek umduğunuz şey tahmin etmek ? Çapraz doğrulama da bu bağlamda …


7
Model karmaşıklığının ölçüleri
İki modelin karmaşıklığını aynı sayıda parametreyle nasıl karşılaştırabiliriz? Edit 09/19 : Açıklığa kavuşturmak için, model karmaşıklığı sınırlı verilerden öğrenmenin ne kadar zor olduğunun bir ölçüsüdür. İki model mevcut verilere eşit derecede uyduğunda, daha düşük karmaşıklığa sahip bir model gelecekteki verilerde daha düşük hata verecektir. Yaklaşımlar kullanıldığında, bu teknik olarak her …


4
Doğrusal, üstel ve logaritmik fonksiyonlardan en uygun eğri uydurma fonksiyonunun belirlenmesi
Bağlam: Matematik Yığın Değişimi (Bir program oluşturabilir miyim) ile ilgili bir sorudan , birisinin bir dizi noktası vardır ve bu eğriye doğrusal, üstel veya logaritmik bir eğri sığdırmak ister. Genel yöntem, bunlardan birini (modeli belirten) seçerek başlamak ve daha sonra istatistiksel hesaplamalar yapmaktır.x - yx-yx-y Ancak asıl istenen, doğrusal, üstel …


1
BIC gerçek bir model bulmaya çalışıyor mu?
Bu soru, I ve diğer pek çok konuda AIC ve BIC arasındaki fark konusunda biraz zorlandığımız bir konuyu takip etmek veya karışıklığı gidermeye çalışmaktır. @Dave Kellen'in bu konuyla ilgili çok güzel bir cevapta ( /stats//a/767/30589 ) okuyoruz: Sorunuz, AIC ve BIC'nin aynı soruya cevap vermeye çalıştığını ima ediyor, bu doğru …

3
Hosmer ve ark. 2013. R Uygulamalı Lojistik Regresyon
Bu benim ilk yazı StackExchange, ama bir süredir kaynak olarak kullanıyorum, uygun formatı kullanmak ve uygun düzenlemeleri yapmak için elimden geleni yapacağım. Ayrıca, bu çok parçalı bir soru. Soruyu birkaç farklı gönderiye mi yoksa sadece bir tanesine mi bölmem gerektiğinden emin değildim. Soruların hepsi aynı metindeki bir bölümden geldiğinden, tek …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.