«model-selection» etiketlenmiş sorular

Model seçimi, bazı setlerden hangi modelin en iyi performansı gösterdiğine karar verme problemidir. Popüler yöntemler şunları içerir:R,2, AIC ve BIC ölçütleri, test setleri ve çapraz doğrulama. Bir dereceye kadar, özellik seçimi, model seçiminin bir alt problemidir.

6
İki farklı Rastgele Orman modelinden R kare karşılaştırması
Ben örneklerde daha tahmin ediciler ile bir "geniş" veri kümesinde sürekli bir sonucu açıklamaya çalışmak için rastgele bir orman modeli geliştirmek için R randomForest paketi kullanıyorum. Özellikle, prosedürün önemli olduğunu düşündüğüm ~ 75 prediktör değişkenleri arasından seçim yapmasına izin veren bir RF modeli takıyorum. Ben kullanarak bu modelin ayrılmış bir …

2
Sadece göreli karşılaştırmalar yerine mutlak olarak kullanılabilecek bir model uygun istatistik (AIC veya BIC gibi) var mı?
Bu literatüre aşina değilim, bu yüzden bu açık bir soru ise lütfen beni affet. AIC ve BIC olasılığı en üst düzeye çıkarmaya bağlı olduğu için, sadece belirli bir veri kümesine uymaya çalışan bir dizi model arasında göreceli karşılaştırmalar yapmak için kullanılabilecekleri görülmektedir. Anladığım kadarıyla, veri kümesi 1'de Model A için …

3
Bayesci model seçimi ve güvenilir aralık
Tüm değişkenlerin nicel olduğu üç değişkenli bir veri kümem var. , ve diyelim . MCMC ile Bayes perspektifinde bir regresyon modeline uyuyorumyyyx1x1x_1x2x2x_2rjags Bir keşif analizi yaptım ve dağılım , ikinci dereceden bir terimin kullanılması gerektiğini gösteriyor. Sonra iki model taktımy×x2y×x2y\times x_2 (1)y=β0+β1∗x1+β2∗x2y=β0+β1∗x1+β2∗x2y=\beta_0+\beta_1*x_1+\beta_2*x_2 (2)y=β0+β1∗x1+β2∗x2+β3∗x1x2+β4∗x21+β5∗x22y=β0+β1∗x1+β2∗x2+β3∗x1x2+β4∗x12+β5∗x22y=\beta_0+\beta_1*x1+\beta_2*x_2+\beta_3*x_1x_2+\beta_4*x_1^2+\beta_5*x_2^2 Model 1'de her parametrenin etki boyutu küçük …


1
Hangi derin öğrenme modeli, birbirini dışlamayan kategorileri sınıflandırabilir
Örnekler: İş tanımında bir cümle var: "İngiltere'de Java kıdemli mühendisi". Derin bir öğrenme modelini 2 kategori olarak tahmin etmek istiyorum: English ve IT jobs. Geleneksel sınıflandırma modeli kullanırsam, sadece softmaxson katmanda işlevli 1 etiket tahmin edebilir . Bu nedenle, her iki kategoride "Evet" / "Hayır" ı tahmin etmek için 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Neden bilgi kriteri (ayarlanmadı)
ARMA-GARCH gibi zaman serisi modellerinde, modelin uygun gecikmesini veya sırasını seçmek için AIC, BIC, SIC vb. Gibi farklı bilgi kriteri kullanılır. Sorum çok basit, neden kullanmıyoruz ayarlanmış R2R2R^2uygun modeli seçmek için? Ayarlanmış daha yüksek değere yol açan modeli seçebilirizR2R2R^2. Çünkü ikisi de ayarlandıR2R2R^2 ve modeldeki ek regresörler için bilgi kriteri …

4
AIC değerinin yorumlanması
Lojistik modeller için gördüğüm tipik AIC değerleri binlerce, en az yüzlerce. örneğin http://www.r-bloggers.com/how-to-perform-a-logistic-regression-in-r/ adresinde AIC 727,39'dur. Her zaman AIC'nin sadece modelleri karşılaştırmak için kullanılması gerektiği söylenirken, belirli bir AIC değerinin ne anlama geldiğini anlamak istedim. Formüle göre A IC= - 2 günlük( L ) + 2 KAIC=−2log⁡(L)+2KAIC= -2 \log(L)+ 2K …

1
K-katlamalı CV ile orijinal (?) Model seçimi
Regresyon modelleri arasında seçim yapmak için k-katlamalı CV kullanırken, genellikle standart hatası SE ile birlikte her model için CV hatasını ayrı ayrı hesaplıyorum ve en düşük CV hatasına sahip modelin 1 SE'sinde en basit modeli seçiyorum (1 standart hata kuralı için buraya bakınız ). Ancak, son zamanlarda bana bu şekilde …

1
Uygun bir puanlama kuralı ne zaman bir sınıflandırma ortamında genellemenin daha iyi bir tahminidir?
Bir sınıflandırma probleminin çözümü için tipik bir yaklaşım, bir aday model sınıfını tanımlamak ve daha sonra çapraz doğrulama gibi bir prosedür kullanarak model seçimi yapmaktır. Tipik olarak, en yüksek doğruluktaki modeli veya gibi soruna özgü bilgileri kodlayan ilgili bir işlevi seçer .FβFβ\text{F}_\beta Nihai hedefin, doğru bir sınıflandırıcı (doğruluk tanımının tekrar …

1
Model seçiminde AIC ve p-değerlerinin denkliği
Bunun cevabı yaptığı yorumda sorusuna , bu modelin seçiminde AIC kullanılarak 0.154 bir p-değeri kullanılarak eşdeğer olduğu belirtildi. Ben tam bir şartname değişkenleri dışarı atmak için bir "geriye" alt küme seçim algoritması kullanılan R, denedim. Birincisi, en yüksek p-değerine sahip değişkeni sırayla dışarı atarak ve tüm p-değerleri 0.154'ün altında olduğunda …

2
İkili sınıflandırma sorunu için hangi SVM çekirdeği kullanılır?
Vektör makinelerini destekleme konusunda yeni başlayan biriyim. Belirli bir soruna hangi çekirdeğin (örn. Doğrusal, polinom) en uygun olduğunu söyleyen bazı yönergeler var mı? Benim durumumda, web sayfalarını belirli bilgiler içerip içermediklerine göre sınıflandırmak zorundayım, yani ikili bir sınıflandırma sorunum var. Genel olarak bu göreve hangi çekirdeğin en uygun olduğunu söyleyebilir …

2
Sorun kümelerinin hesaplanması, yorumlanması ve model seçim prosedürü hakkında genel sorular
Kullanarak modelleri seçmek istiyorum regsubsets(). Olympiadaten adlı bir veri çerçevem ​​var (yüklenen veriler: http://www.sendspace.com/file/8e27d0 ). Önce bu veri çerçevesini ekleyin ve sonra analiz etmeye başlar, benim kod: attach(olympiadaten) library(leaps) a<-regsubsets(Gesamt ~ CommunistSocialist + CountrySize + GNI + Lifeexp + Schoolyears + ExpMilitary + Mortality + PopPoverty + PopTotal + ExpEdu …


4
Çoklu regresyondaki değişken sayısını azaltmak
Bir endeks fonunun zaman içindeki davranışını tahmin etmek için çoklu regresyonda kullanılabilecek birkaç yüz finansal değişkenin değerlerinden oluşan büyük bir veri setim var. Mümkün olduğu kadar tahmin gücünü korurken değişkenlerin sayısını on'a kadar azaltmak istiyorum. Eklendi: Orijinal değişkenlerin ekonomik anlamını korumak için azaltılmış değişken kümesinin orijinal değişkenin bir alt kümesi …

1
Bayes bilgi kriterinde ayrık veya ikili parametrelerin muhasebeleştirilmesi
BIC, parametre sayısına göre cezalandırır. Parametrelerin bazıları bir tür ikili gösterge değişkenleri ise ne olur? Bunlar tam parametre olarak sayılıyor mu? Ancak ikili parametrelerini değerlerini alan tek bir değişkende birleştirebilirim . Bunlar parametresi veya bir parametre olarak mı sayılmalıdır ?mmm{ 0 , 1 , . . . ,2m- 1 }{0,1,...,2m-1}\{0,1,...,2^m-1\}mmm

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.