«bootstrap» etiketlenmiş sorular

Bootstrap, bir istatistiğin örnekleme dağılımını tahmin etmek için bir yeniden örnekleme yöntemidir.

3
Bootstrap ve permütasyon hipotez testleri
Uygulamada sıklıkla kullanılan, önyükleme, permütasyon testi, jackknife, vb. Gibi pek çok popüler yeniden örnekleme tekniği vardır. Bu teknikleri tartışan çok sayıda makale ve kitap vardır, örneğin Philip I Good (2010) Permütasyon, Parametrik ve Bootstrap Testleri Hipotezler Sorum şu ki, hangi yeniden örnekleme tekniği daha popüler ve daha kolay bir şekilde …

5
CV / Bootstrap kullanarak makine öğrenim algoritmalarını çalıştırabilir misiniz?
Bu soru kesin bir cevap alamayacak kadar açık uçlu olabilir, ama umarım değil. SVM, GBM, Rastgele Orman vb. Gibi makine öğrenmesi algoritmaları, genellikle bazı rehberlik kurallarının ötesinde, her bir veri setine ayarlanması gereken bazı ücretsiz parametrelere sahiptir. Bu genellikle, en iyi genelleme hatasını veren parametre setine uyması için bir çeşit …

3
Rastgele ormanlar aykırı değerlere nasıl duyarlı değildir?
Ben dahil olmak üzere birkaç kaynaklardan okudum bu bir Rastgele Ormanlar (örneğin, Lojistik Regresyon ve diğer ML yöntemlerdir bu şekilde) uçlara karşı duyarlıdır olmadığını. Ancak iki sezgi bana aksini söylüyor: Bir karar ağacı ne zaman yapılırsa, bütün puanların sınıflandırılması gerekir. Bu, aykırıların bile sınıflandırılacağı ve dolayısıyla yükseltme sırasında seçildikleri karar …

2
Önyükleme yöntemi için önerilen örneklem boyutunun belirlenmesi / Önerilen Yöntem
Bunun kimsenin gerçekten basit bir cevap veremediği çok sıcak bir konu olduğunu biliyorum. Bununla birlikte, aşağıdaki yaklaşımın faydalı olup olmayacağını merak ediyorum. Önyükleme yöntemi yalnızca, örneğin orijinal popülasyonla aynı dağılımı en az veya daha az takip ederse (tam olarak okuyun) kullanışlıdır. Emin olmak için bu, örnek büyüklüğünüzü yeterince büyük yapmanız …

2
Zaman serisi verileriyle önyükleme nasıl yapılır?
Kısa süre önce, tahmin ediciler için standart hataları ve güven aralıklarını hesaplamak için önyükleme tekniklerini kullanmayı öğrendim. Öğrendiğim şey, verilerin IID olması durumunda, örnek verileri popülasyon olarak değerlendirebileceğiniz ve yerine yenisini alarak örnekleme yapabildiğiniz ve bunun bir test istatistiğinin çoklu simülasyonlarını almanıza olanak sağlayacağıydı. Zaman serileri durumunda, bunu açıkça yapamazsınız …

4
Yüzdelik önyüklemenin hiç kullanılmaması gerektiği doğru mu?
18.05 MIT OpenCourseWare notlarında, Olasılık ve İstatistiğe Giriş, Bahar 2014 (şu anda burada mevcut ): Önyükleme yüzdelik metodu sadeliği nedeniyle çekici. Bununla birlikte, bir önyükleme dağılımına bağlıdır bir göre özellikle gerçek dağılımı çok yakın bir olmak örnek . Rice, yüzdelik yöntemden bahseder: “Önyükleme örneklemesi dağılımının güven sınırları olan miktarlarının doğrudan …

4
Önyargı önyükleme tahmini ne zaman geçerlidir?
Önyükleme işleminin tahmin edicideki önyargı tahminini sağlayabildiği sık sık iddia edilmektedir. Eğer T bir istatistik için tahmini ve ~ t i önyükleme kopyaları vardır ile ( i ∈ { 1 , ⋯ , N } ), daha sonra önyargı önyükleme tahminidir ki bu oldukça huzursuz görünüyor.t^t^\hat tt~it~i\tilde t_ii∈{1,⋯,N}i∈{1,⋯,N}i\in\{1,\cdots,N\}biast≈1N∑it~i−t^biast≈1N∑it~i−t^\begin{equation} \mathrm{bias}_t \approx …
31 bootstrap  bias 

2
Eğri dağılımın ortalaması için güvenilir bir parametrik olmayan güven aralığı var mı?
Log-normal gibi çok eğimli dağılımlar, doğru önyükleme güven aralıklarıyla sonuçlanmaz. Aşağıda sol ve sağ kuyruk bölgelerinin R'de hangi önyükleme yöntemini kullandığınızdan bağımsız olarak ideal 0.025'ten uzak olduğunu gösteren bir örnek verilmiştir: require(boot) n <- 25 B <- 1000 nsim <- 1000 set.seed(1) which <- c('basic', 'perc', 'norm', 'bca', 'stud') mul …

3
Hakemli açık kaynaklı dergi için tavsiye?
Tek bir ortalama hipotezini test etmek için bir bootstrap metodu ile ilgili bir el yazması var ve onu yayın için göndermek istiyorum, ama ahlaki bir ikilemim var. Elsevier'e karşı etik dışı iş uygulamalarını protesto etmek için imza atmıştım ve bu konuyu okumak, diğer kâr amacı gütmeyen akademik dergilerin etiğini sorgulamamı …

3
Neden bir önyükleme dağılımının ortalamasını bildirmiyorsunuz?
Biri standart hatayı elde etmek için bir parametreyi patlattığında, parametrenin bir dağılımını elde ederiz. Neden bu dağılımın ortalamasını bir sonuç olarak kullanmıyoruz veya almaya çalıştığımız parametre için tahmin yapmıyoruz? Dağılım, gerçekte yaklaşık değil mi? Bu nedenle “gerçek” değer hakkında iyi bir tahminde bulunacağız. Yine de örneklemimizden aldığımız orijinal parametreyi rapor …

2
Önyükleme, tahmin edicinin örnekleme dağılımını yaklaşık olarak ne kadar gösterir?
Son zamanlarda bootstrap okuduktan sonra, beni hala şaşırtan kavramsal bir soru buldum: Bir popülasyonunuz var ve popülasyonu temsil etmek için P kullandığım bir popülasyon niteliğini, yani bilmek istiyorsunuz . Bu θ örneğin nüfus ortalama olabilir. Genellikle popülasyondaki tüm verileri alamazsınız. Böylece N popülasyonundan N büyüklüğünde bir X örneği çizersiniz. Diyelim …

5
Önyükleme aralığım neden kapsama alanı çok kötü?
Bir t-aralığını bir önyükleme aralığına göre karşılaştırdığım ve her ikisinin de kapsama olasılığını hesapladığım bir sınıf gösteri yapmak istedim. Verilerin çarpık bir dağılımdan gelmesini istedim, böylece verileri exp(rnorm(10, 0, 2)) + 1değiştirilmiş bir lognormal'den 10 büyüklüğünde bir örnek olarak oluşturmayı seçtim . 1000 örnek çizmek için bir senaryo yazdım ve …

1
Önyükleme tahmini aralığı
Örneğin doğrusal regresyondan veya diğer regresyon yönteminden (k-en yakın komşu, regresyon ağaçları vb.) Elde edilen nokta tahminleri için tahmin aralıklarını hesaplamak için mevcut herhangi bir önyükleme tekniği var mı? Her nasılsa, bazen kestirilen nokta tahminini sadece ön plana çıkarmak için önerilen yolun (bakınız örn. KNN regresyonunun öngörülen aralık aralıkları) bir …

3
R ile önyükleme kullanarak p-değerini hesaplama
Yaklaşık 2 taraflı bootstrapped p değerini hesaplamak için "boot" paketini kullanıyorum, ancak sonuç t.test kullanmanın p değerinden çok uzak. R kodumda ne yanlış yaptığımı çözemiyorum. Birisi lütfen bana bunun için bir ipucu verebilir time = c(14,18,11,13,18,17,21,9,16,17,14,15, 12,12,14,13,6,18,14,16,10,7,15,10) group=c(rep(1:2, each=12)) sleep = data.frame(time, group) require(boot) diff = function(d1,i){ d = d1[i,] …

1
Serbestlik dereceleri tam sayı olmayan bir sayı olabilir mi?
GAM kullandığımda, artık DF (kodun son satırı) olduğunu gösteriyor. Bu ne anlama geliyor? GAM örneğinin ötesine geçmek, Genel olarak, serbestlik derecelerinin sayısı tam sayı olmayan bir sayı olabilir mi?26,626,626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.