«bootstrap» etiketlenmiş sorular

Bootstrap, bir istatistiğin örnekleme dağılımını tahmin etmek için bir yeniden örnekleme yöntemidir.

1
Bootstrap: tahmin, güven aralığının dışında
Karışık bir model ile bir önyükleme yaptım (etkileşimli birkaç değişken ve bir rastgele değişken). Bu sonucu aldım (sadece kısmi): > boot_out ORDINARY NONPARAMETRIC BOOTSTRAP Call: boot(data = a001a1, statistic = bootReg, R = 1000) Bootstrap Statistics : original bias std. error t1* 4.887383e+01 -1.677061e+00 4.362948e-01 t2* 3.066825e+01 1.264024e+00 5.328387e-01 t3* …

2
Küme düzeyinde mi yoksa bireysel düzeyde mi önyükleme yapmalıyım?
Hastanelerde iç içe geçmiş, hastaneler için rastgele bir etki içeren hastalar ile bir hayatta kalma modelim var. Rastgele etki gama dağıtılır ve bu terimin 'alaka düzeyini' kolayca anlaşılan bir ölçekte rapor etmeye çalışıyorum. Medyan Tehlike Oranını (Medyan Oran Oranı gibi) kullanan aşağıdaki referansları buldum ve bunu hesapladım. Bengtsson T, Dribe …

2
Önyükleme kullanabilir miyim, neden ya da neden olmasın?
Şu anda uydu görüntülerini kullanarak biyokütle tahminleri üzerinde çalışıyorum. Sorumun arka planını hızlı bir şekilde tanımlayacağım ve üzerinde çalıştığım istatistiksel soruyu açıklayacağım. Arka fon Sorun Fransa'da bir bölgede biyokütle tahmin etmeye çalışıyorum. Benim yanıt steamwood hacim yoğunluğudur (içinde biyokütle daha fazla ya da daha az orantılıdır) (... ahşap yoğunlukları bağlı …
10 bootstrap 

1
Anova () ve drop1 () neden GLMM'ler için farklı cevaplar verdi?
Formun bir GLMM var: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kullandığımda , araç paketinden veya drop1(model, test="Chi")kullandığımdan farklı sonuçlar alıyorum . Bu son ikisi aynı cevapları verir.Anova(model, type="III")summary(model) Bir grup uydurma veri kullanarak, bu iki yöntemin normalde farklı olmadığını gördüm. Dengeli doğrusal …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

2
Yeniden örnekleme için iyi bir metin mi?
Grup uygulamalı yeniden örnekleme tekniklerine iyi bir giriş metni / kaynağı önerebilir mi? Özellikle, normallik gibi varsayımlar açıkça ihlal edildiğinde grupları karşılaştırmak için klasik parametrik testlere (örn. T testleri, ANOVA, ANCOVA) alternatiflerle ilgileniyorum. Daha iyi bir çözüm yolu olarak kendimi eğitmek istediğim örnek bir sorun türü aşağıdakileri içerebilir: I) 2 …

2
Hiyerarşik verilerden önyüklenmiş güven aralıklarını edinme ve yorumlama
Bu miktar 10 kişiden 10'unda ölçüldüğünde, X miktarı üzerinde önyüklenmiş bir güven aralığı elde etmekle ilgileniyorum. Bir yaklaşım, her bir birey için ortalamanın elde edilmesidir, daha sonra vasıtaların önyüklenmesini sağlar (örn., Vasıtaları değiştirerek yeniden örnekleme). Başka bir yaklaşım, önyükleme prosedürünün her yinelemesinde aşağıdakileri yapmaktır: her bireyde, bireyin 10 gözlemini değiştirme …

3
Bootstrap regresyonundan katsayıların p-değerleri nasıl elde edilir?
Robert Kabacoff en düşük Hızlı-R Ben # Bootstrap 95% CI for regression coefficients library(boot) # function to obtain regression weights bs <- function(formula, data, indices) { d <- data[indices,] # allows boot to select sample fit <- lm(formula, data=d) return(coef(fit)) } # bootstrapping with 1000 replications results <- boot(data=mtcars, statistic=bs, …

3
Kalıntıları önyükleme: Doğru mu yapıyorum?
Her şeyden önce: Anladığım kadarıyla, bootstrapping kalıntıları aşağıdaki gibi çalışır: Modeli verilere sığdır Kalıntıları hesaplayın Kalıntıları yeniden örnekleyin ve 1'e ekleyin. Modeli 3'ten yeni veri kümesine sığdır. nSüreleri tekrarlayın , ancak her zaman yeniden örneklenen kalıntıları 1'den uygunluğa ekleyin. Bu şimdiye kadar doğru mu? Ne yapmak istediğim biraz farklı bir …


1
R doğrusal regresyon kategorik değişkeni “gizli” değer
Bu sadece birkaç kez karşılaştığım bir örnektir, bu yüzden örnek verilerim yok. R'de doğrusal regresyon modeli çalıştırmak: a.lm = lm(Y ~ x1 + x2) x1sürekli bir değişkendir. x2kategoriktir ve üç değeri vardır, örneğin "Düşük", "Orta" ve "Yüksek". Bununla birlikte, R tarafından verilen çıktı aşağıdaki gibi olacaktır: summary(a.lm) Estimate Std. Error …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
Hangi derin öğrenme modeli, birbirini dışlamayan kategorileri sınıflandırabilir
Örnekler: İş tanımında bir cümle var: "İngiltere'de Java kıdemli mühendisi". Derin bir öğrenme modelini 2 kategori olarak tahmin etmek istiyorum: English ve IT jobs. Geleneksel sınıflandırma modeli kullanırsam, sadece softmaxson katmanda işlevli 1 etiket tahmin edebilir . Bu nedenle, her iki kategoride "Evet" / "Hayır" ı tahmin etmek için 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
Önyükleme örneğinin orijinal örnekle tamamen aynı olması olasılığı
Sadece bir neden kontrol etmek istiyorum. Orijinal örneğim boyutundaysa ve önyükleme yapıyorsam, düşünce sürecim aşağıdaki gibidir:nnn 1n1n\frac{1}{n} , orijinal örnekten alınan herhangi bir gözlem şansıdır. Sonraki çekilişin önceden örneklenmiş gözlem olmadığından emin olmak için örnek boyutunu n-1 ile sınırlandırıyoruz n - 1n-1n-1. Böylece, bu kalıbı elde ederiz: 1n⋅1n - 1⋅1n …

2
Bootstrap örneklerinin boyutu
Örnek istatistiğin varyansını tahmin etmenin bir yolu olarak önyüklemeyi öğreniyorum. Temel bir şüphem var. Http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf adresinden alıntı : • Kaç gözlemi tekrar örneklemeliyiz? İyi bir öneri orijinal numune boyutudur. Orijinal örnekteki kadar gözlemi nasıl yeniden örnekleyebiliriz? 100 örnek büyüklüğüm varsa ve ortalamanın varyansını tahmin etmeye çalışıyorum. Toplam 100 numune büyüklüğünden …

2
Lineer regresyonda x kesişiminin güven aralığı nasıl hesaplanır?
Yanıt değişkeni için genellikle doğrusal bir regresyonun standart hatası verildiğinden, diğer yönde güven aralıklarının nasıl elde edileceğini merak ediyorum - örneğin bir x kesişimi için. Ne olabileceğini görselleştirebiliyorum, ama eminim bunu yapmanın basit bir yolu olmalı. Aşağıda, R'nin bunun nasıl görselleştirileceğine ilişkin bir örneği bulunmaktadır: set.seed(1) x <- 1:10 a …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.