«sampling» etiketlenmiş sorular

Olasılıksal bir yöntem kullanarak iyi belirlenmiş bir popülasyondan numune oluşturma ve / veya belirtilen bir dağılımdan rastgele sayılar üretme. Bu etiket belirsiz olduğundan, lütfen eski için [anket örnekleme] ve ikincisi için [monte-carlo] veya [simülasyon] düşünün. Bilinen dağıtımlardan rastgele örnek oluşturma ile ilgili sorular için lütfen [rastgele oluşturma] etiketini kullanmayı düşünün.

2
Küçük örneklem büyüklüğü verileri için eğitim, çapraz doğrulama ve test seti boyutları nasıl seçilir?
Küçük bir örnek boyutum olduğunu varsayalım, örneğin N = 100 ve iki sınıf. Makine öğrenimi için eğitim, çapraz doğrulama ve test seti boyutlarını nasıl seçmeliyim? Sezgisel olarak seçerdim Eğitim seti boyutu 50 Çapraz doğrulama seti boyutu 25 ve Boyutu 25 olarak test edin. Ama muhtemelen bu az ya da çok …

3
Amerikan Topluluğu Araştırması çeşitlilik verilerinin yeniden ağırlıklandırılması, hata paylarını nasıl etkiler?
Arka plan: Kuruluşum şu anda işgücü çeşitliliği istatistiklerini (örn.% Engelli kişiler,% kadın, gazi yüzdesi) Amerikan Topluluğu Araştırması'na (ABD Nüfus Sayım Bürosu tarafından yürütülen bir anket projesi) dayanan bu grupların toplam işgücü mevcudiyeti ile karşılaştırmaktadır. Bu yanlış bir ölçüttür, çünkü bir bütün olarak işgücünden farklı demografik özelliklere sahip çok özel bir …

1
Üst düzey anlarla Gauss benzeri dağıtım
Ortalama ve varyansı bilinmeyen Gauss dağılımı için standart üstel aile formundaki yeterli istatistikler . olan bir dağıtım var , burada N tür bir tasarım parametresi gibi. Bu tür yeterli istatistik vektörü için karşılık gelen bilinen bir dağılım var mı? Bu dağıtımdan örneklere ihtiyacım var, bu yüzden dağıtımdan kesin örnekler almak …

1
Anova () ve drop1 () neden GLMM'ler için farklı cevaplar verdi?
Formun bir GLMM var: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kullandığımda , araç paketinden veya drop1(model, test="Chi")kullandığımdan farklı sonuçlar alıyorum . Bu son ikisi aynı cevapları verir.Anova(model, type="III")summary(model) Bir grup uydurma veri kullanarak, bu iki yöntemin normalde farklı olmadığını gördüm. Dengeli doğrusal …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
Quantile'un tanımı
N örneklenmiş değerler göz önüne alındığında, "örneklenen değerlerin p-inci kantilesi" ne anlama gelir?
10 sampling 

3
Yüksek boyutlu bir işlevin beklenen değerini değerlendirmek için MCMC kullanma
Optimizasyonla ilgili bir araştırma projesi üzerinde çalışıyorum ve yakın zamanda bu ortamda MCMC kullanma fikri vardı. Ne yazık ki, MCMC yöntemlerinde oldukça yeniyim, bu yüzden birkaç sorum vardı. Sorunu tanımlayıp ardından sorularımı sorarak başlayacağım. bir maliyet fonksiyonunun beklenen değerini tahmin burada , yoğunluğuna sahip dimentional rastgele bir değişkendir. .c(ω)c(ω)c(\omega)ω=(ω1,ω2,...ωh)ω=(ω1,ω2,...ωh)\omega = …

2
Negatif olmayan tamsayılarda ayrık dağılımdan nasıl örnek alınır?
Aşağıdaki bağımsız dağıtım var, burada bilinen sabitler:α , βα,β\alpha,\beta p ( x ; α , β) =Beta ( α + 1 , β+ x )Beta ( α , β)için x = 0 , 1 , 2 , ...p(x;α,β)=Beta(α+1,β+x)Beta(α,β)için x=0,1,2,... p(x;\alpha,\beta) = \frac{\text{Beta}(\alpha+1, \beta+x)}{\text{Beta}(\alpha,\beta)} \;\;\;\;\text{for } x = 0,1,2,\dots Bu dağıtımdan …

3
Rasgele olmayan numunenin randomizasyonu
Deneysel çalışmalara katılmak için psikolojik reklamlar gördüğüm için her zaman biraz şaşırdım. Elbette, bu reklamlara cevap veren insanlar rastgele örneklenmezler ve bu nedenle kendi seçtikleri bir nüfustur. Rasgeleleştirmenin kendi kendine seçim problemini çözdüğü bilindiğinden, rasgele olmayan bir numunenin randomizasyonunun gerçekten bir şey değiştirip değiştirmediğini merak ediyordum. Ne düşünüyorsun ? Ve …

2
Markov zincir tabanlı örnekleme Monte Carlo örneklemesi için “en iyi” midir? Mevcut alternatif şemalar var mı?
Markov Zinciri Monte Carlo, numuneleri doğrudan çizemediğimiz standart olmayan dağıtımlardan (Monte Carlo ortamında) numune almamıza izin veren Markov zincirlerine dayanan bir yöntemdir. Benim sorum Markov zincirinin Monte Carlo örneklemesi için neden "son teknoloji" olduğudur. Alternatif bir soru, Monte Carlo örneklemesi için kullanılabilecek Markov zincirleri gibi başka yollar var mı? MCMC'nin …

1
Telefon rehberinden örnekleme hakkında bir hikaye için referans
Bugün birisiyle örnekleme hakkında konuşuyordum ve belirli bir yasal davada telefon rehberinden sistematik örnekleme öneren çok saygın bir istatistikçi hakkında bir hikayeyi belirsiz bir şekilde hatırlıyorum. Hikayenin mahkemede hâkim gibi bir şey olduğunu "İstatistikler hakkında çok şey bilmiyorum, ama her 100 üncü isimden örneklemenin doğru olmadığını biliyorum" şeklinde bir şey …

4
Dirençlerin paralel olarak varyansı
Her biri ortalama μ ve varyans σ ile dağıtılan bir dizi R direnciniz olduğunu varsayalım. Aşağıdaki düzende bir devrenin bir bölümünü düşünün: (r) || (r + r) || (R + R + r). Her parçanın eşdeğer direnci r, 2r ve 3r'dir. Her bölümün varyansı daha sonra σ2σ2σ^2 , 2σ22σ22σ^2 , …

1
R doğrusal regresyon kategorik değişkeni “gizli” değer
Bu sadece birkaç kez karşılaştığım bir örnektir, bu yüzden örnek verilerim yok. R'de doğrusal regresyon modeli çalıştırmak: a.lm = lm(Y ~ x1 + x2) x1sürekli bir değişkendir. x2kategoriktir ve üç değeri vardır, örneğin "Düşük", "Orta" ve "Yüksek". Bununla birlikte, R tarafından verilen çıktı aşağıdaki gibi olacaktır: summary(a.lm) Estimate Std. Error …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 


1
Hangi derin öğrenme modeli, birbirini dışlamayan kategorileri sınıflandırabilir
Örnekler: İş tanımında bir cümle var: "İngiltere'de Java kıdemli mühendisi". Derin bir öğrenme modelini 2 kategori olarak tahmin etmek istiyorum: English ve IT jobs. Geleneksel sınıflandırma modeli kullanırsam, sadece softmaxson katmanda işlevli 1 etiket tahmin edebilir . Bu nedenle, her iki kategoride "Evet" / "Hayır" ı tahmin etmek için 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
Önyükleme örneğinin orijinal örnekle tamamen aynı olması olasılığı
Sadece bir neden kontrol etmek istiyorum. Orijinal örneğim boyutundaysa ve önyükleme yapıyorsam, düşünce sürecim aşağıdaki gibidir:nnn 1n1n\frac{1}{n} , orijinal örnekten alınan herhangi bir gözlem şansıdır. Sonraki çekilişin önceden örneklenmiş gözlem olmadığından emin olmak için örnek boyutunu n-1 ile sınırlandırıyoruz n - 1n-1n-1. Böylece, bu kalıbı elde ederiz: 1n⋅1n - 1⋅1n …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.