«sampling» etiketlenmiş sorular

Olasılıksal bir yöntem kullanarak iyi belirlenmiş bir popülasyondan numune oluşturma ve / veya belirtilen bir dağılımdan rastgele sayılar üretme. Bu etiket belirsiz olduğundan, lütfen eski için [anket örnekleme] ve ikincisi için [monte-carlo] veya [simülasyon] düşünün. Bilinen dağıtımlardan rastgele örnek oluşturma ile ilgili sorular için lütfen [rastgele oluşturma] etiketini kullanmayı düşünün.

12
Neden bir% 95 Güven Aralığı (CI) ortalamayı içeren bir% 95 şans anlamına gelmiyor?
Buradaki çeşitli ilgili sorularla, "% 95 güven aralığı" dediğimiz şeyin "% 95" bölümünün, örnekleme ve CI-hesaplama prosedürlerimizi birçok kez tam olarak çoğaltacak olmamız gerektiği anlamına geldiği konusunda fikir birliği olduğu anlaşılıyor. Bu şekilde hesaplanan CI'lerin% 95'i popülasyon ortalamasını içerecektir. Ayrıca, bu tanımın yapmaması konusunda fikir birliği var gibitek bir% 95 …

8
Örnekleme 'büyük veri' zamanında önemli midir?
Ya da daha fazla "olacak" mı? Büyük Veri , istatistikleri ve ilgili bilgileri daha da önemli hale getirir ancak Örnekleme Teorisinin altını çizer. Bu yutturmaca 'Büyük Veri' etrafında gördüm ve "neden" her şeyi analiz etmek isteyeyim merak ediyorum yardımcı olamaz ? "Örnekleme Teorisi" nin tasarlanması / uygulanması / icat edilmesi …

5
Örnek medyanlar için merkezi limit teoremi
Aynı dağılımdan çizilen yeterince fazla sayıda gözlemin ortancasını hesaplarsam, merkezi limit teoremi medyanların dağılımının normal bir dağılıma yaklaşacağını belirtir mi? Anladığım kadarıyla, bu çok sayıda örneklem aracıyla doğru, ancak medyanlar için de doğru mu? Değilse, örnek medyanların altında yatan dağılım nedir?

5
Örneklem popülasyonda “olduğunda” istatistiksel çıkarım
Yıllık olarak belirli bir sınava giren adayların sayısını bildirmek zorunda olduğunuzu hayal edin. Hedef popülasyonun niteliği nedeniyle, daha geniş bir popülasyonda, örneğin, gözlenen başarının% 'sini anlamak oldukça zor görünüyor. Yani bu verilerin tüm popülasyonu temsil ettiğini düşünebilirsiniz. Erkek ve kadın oranlarının farklı olduğunu gösteren testlerin sonuçları gerçekten doğru mu? Gözlemlenen …

4
Alışılmış bir programlama dili kullanılarak bilinen ortalama ve varyans ile normal bir dağılımdan nasıl örnek alınır?
Daha önce istatistiklerle ilgili bir ders almadım, umarım burada doğru yerde soruyorum. Normal bir dağılımı tanımlayan sadece iki verim olduğunu varsayalım: ortalama ve variance . Bu dağıtıma rastgele örnekleme yapmak için bir bilgisayar kullanmak istiyorum, öyle ki bu iki istatistiğe saygı duyuyorum.σ 2μμ\muσ2σ2\sigma^2 Ortalamayı 0 civarında normalleştirerek halledebileceğim çok açık: …

5
Örneklem büyüklüğünü artırmak neden örnekleme değişimini düşürür?
Büyük fotoğraf: Örneklem büyüklüğünün arttırılmasının denemenin gücünü nasıl artırdığını anlamaya çalışıyorum. Öğretim elemanımın slaytları bunu, biri normal olmayan hipotez için diğeri alternatif hipotez için olan ve aralarındaki bir karar eşiğindeki 2 normal dağılımın resmi ile açıklar. Artan örneklem büyüklüğünün varyansı azaltacağını ve böylece daha yüksek kurtoza neden olacağını, böylece eğrilerdeki …


5
Politik anketlerin neden bu kadar büyük örneklem boyutları var?
Haberleri izlediğimde, Gallup'un cumhurbaşkanlığı seçimleri gibi şeylere yönelik anketlerin 1000'den fazla örneklem büyüklüğüne sahip olduğunu gördüm. Üniversite istatistiklerinden hatırladığım kadarıyla 30'luk bir örneklem büyüklüğünün "oldukça büyük" bir örnek olmasıydı. 30'un üzerindeki bir örneklem büyüklüğünün azalan verimlerden dolayı anlamsız olduğu görülmüştür.

5
Örnekleme dağılımını öğretme stratejileri
Tl; dr sürümü Örnekleme dağılımını (örneğin ortalama bir örnek olarak) giriş seviyesi bir lisans düzeyinde öğretmek için hangi başarılı stratejileri kullanıyorsunuz? Arkaplan Eylül ayında , David Moore tarafından Temel İstatistik Uygulaması'nı kullanan ikinci sınıf sosyal bilimler (temel olarak siyaset bilimi ve sosyoloji) öğrencileri için tanıtım istatistiği dersi vereceğim . Bu …

3
R: Veri setinde NaN bulunmamasına rağmen “yabancı işlev çağrısı” na NaN / Inf atma Rastgele Orman [kapalı]
Bir veri kümesi üzerinde çapraz doğrulanmış rasgele bir orman çalıştırmak için şapka kullanıyorum. Y değişkeni bir faktördür. Veri setimde hiç NaN, Inf veya NA yok. Ancak rastgele orman çalıştırırken, alıyorum Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use …

7
Önceki madeni para basmalarının sonuçlarının, sonraki madeni para basmalarına ilişkin inançları etkilediği istatistiksel yanlışlığın adı nedir?
Hepimizin bildiği gibi, kuyruklarla aynı derecede iniş şansı olan bir madeni parayı çevirirseniz, o zaman madeni parayı birçok kez çevirirseniz, yarısı kafa alırsınız ve yarısı kuyruk alırsınız. Bunu bir arkadaşınızla tartışırken, madeni parayı 1000 kez çevirirseniz ve ilk 100 kez kafa attığını söyleseniz, kuyruğun iniş yapma şansının arttığını söylerlerdi (mantık …

3
Ya rastgele numaranız açıkça temsili değilse?
Ne rastgele bir örnek alırsanız ve son bir soruda olduğu gibi açıkça temsili olmadığını görebilirsiniz . Örneğin, popülasyon dağılımının 0 civarında simetrik olması gerekiyorsa ve rastgele çizdiğiniz örnek dengesiz pozitif ve negatif gözlemlere sahipse ve dengesizlik istatistiksel olarak önemliyse, sizi nereye bırakır? Önyargılı bir örneği temel alan nüfus hakkında ne …

3
“Bağımsız gözlemler” ne anlama geliyor?
Bağımsız gözlem varsayımının ne anlama geldiğini anlamaya çalışıyorum . Bazı tanımlar: "İki olay yalnızca ise bağımsızdır P(a∩b)=P(a)∗P(b)P(bir∩b)=P(bir)*P(b)P(a \cap b) = P(a) * P(b)." ( İstatistiksel Terimler Sözlüğü ) "bir olayın meydana gelmesi bir başkasının olasılığını değiştirmez" ( Wikipedia ). “bir gözlemin örneklenmesi, ikinci gözlemin seçimini etkilemez” ( David M. Lane …

1
Bir lmer modelden etkilerin tekrarlanabilirliğinin hesaplanması
Bu yazıda , karışık etki modellemesi ile bir ölçümün tekrarlanabilirliğini (diğer bir deyişle güvenilirlik, sınıf içi korelasyon) nasıl hesaplayacağımı anladım . R kodu şöyle olurdu: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

1
Serbestlik dereceleri tam sayı olmayan bir sayı olabilir mi?
GAM kullandığımda, artık DF (kodun son satırı) olduğunu gösteriyor. Bu ne anlama geliyor? GAM örneğinin ötesine geçmek, Genel olarak, serbestlik derecelerinin sayısı tam sayı olmayan bir sayı olabilir mi?26,626,626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.