«sample» etiketlenmiş sorular

Örnek, bir popülasyonun alt kümesidir. İstatistikler, genel olarak, daha büyük (muhtemelen sonsuz) bir popülasyonu yöneten parametreler hakkında çıkarım yapmak için örneklerin kullanılmasıyla ilgilidir.

4
Genel olarak değiştirilmeden, büyük bir listeden 10'dan fazla örnek nasıl alınır
10 veri noktasının tekrarlanan örneklerini almak istediğim geniş bir veri setim var (20.000 veri noktası). Ancak, bu 10 veri noktasını seçtikten sonra, tekrar seçilmemelerini istiyorum. sampleFonksiyonu kullanmayı denedim , ancak fonksiyonun birden fazla çağrısı yerine değiştirmeden örnekleme seçeneği yok gibi görünüyor. Bunu yapmanın kolay bir yolu var mı?
12 r  sample 

1
Popülasyon ortalaması biliniyorsa popülasyonun varyansını tahmin edin
Bir popülasyonun varyansını tahmin etmek için kullandığımızı biliyorum . Khan Academy'den verilen sezginin tahmini ortalamamızın muhtemelen gerçek olanın biraz dışında olduğu bir video hatırlıyorum, bu nedenle mesafeleri daha büyük olurdu, bu yüzden daha az bölüyoruz ( yerine ) daha iyi bir değer elde etmek için daha büyük bir değer elde …
11 variance  sample 

5
Poisson değilse, bu hangi dağıtımdır?
7 gün boyunca bireylerin gerçekleştirdiği eylem sayısını içeren bir veri setim var. Özel eylem bu soru için geçerli olmamalıdır. Veri kümesi için bazı tanımlayıcı istatistikler: AralıkAnlamına gelmekVaryansGözlem sayısı0 - 77218.22791696Range0−772Mean18.2Variance2791Number of observations696 \begin{array}{|c|c|} \hline \text{Range} & 0 - 772 \\ \hline \text{Mean} & 18.2 \\ \hline \text{Variance} & 2791 \\ …

1
SurveyMonkey rastgele olmayan bir örnek aldığınız gerçeğini yoksayar mı?
SurveyMonkey, nüfus büyüklüğünüze bağlı olarak belirli bir hata veya güven aralığı aralığı için hangi örnek boyutuna ihtiyacınız olduğunu anlamanız için adımlar ve bir grafik içerir. SurveyMonkey örnek boyutu Bu grafik, yalnızca ankete yanıt vermek için rahatsız olan insanları aldığınız için rastgele bir örnek alamayacağınız gerçeğini görmezden geliyor mu? Bu soru …

1
Neden bir numune oranının binom dağılımı da yok
Bir binom ayarında, başarıların sayısını veren rastgele değişken X, binom olarak dağıtılır. Örnek oranı daha sonra X olarak hesaplanabilir buradaörnek numaranızn'dir. Ders kitabım şöyle diyorXnXn\frac{X}{n}nnn Bu oran yok değil bir binom dağılıma sahip ancak X'ten beri sadece binom olarak dağıtılmış rastgele değişkenX'inölçekli bir versiyonudur, binom dağılımıda olmamalı mı?XnXn\frac{X}{n}XXX

2
Bir kümenin bir örneğini kullanarak birden çok kümenin kesişim boyutunun tahmin edilmesi
En az 2 kümenin kesişimleri tarafından oluşturulan bir kümenin boyutunu hesaplamak için gereken bir algoritma üzerinde çalışıyorum. Daha spesifik olarak: z=|A0∩…∩An|z=|A0∩…∩An| z = \left |A_0 \cap \ldots \cap A_n \right | Kesişen kümeler SQL sorguları tarafından oluşturulur ve işleri hızlı tutma çabasıyla, her sorgudan önce bir sayı alırım, sonra en …
10 error  sample 

1
R doğrusal regresyon kategorik değişkeni “gizli” değer
Bu sadece birkaç kez karşılaştığım bir örnektir, bu yüzden örnek verilerim yok. R'de doğrusal regresyon modeli çalıştırmak: a.lm = lm(Y ~ x1 + x2) x1sürekli bir değişkendir. x2kategoriktir ve üç değeri vardır, örneğin "Düşük", "Orta" ve "Yüksek". Bununla birlikte, R tarafından verilen çıktı aşağıdaki gibi olacaktır: summary(a.lm) Estimate Std. Error …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 


2
Veriler için ROC eğrisini hesapla
Bu yüzden, Hamming Distance kullanarak biyometrik özellikteki bir kişinin kimliğini doğrulamaya çalıştığım 16 denemem var. Eşik değer 3,5'e ayarlandı. Verilerim aşağıda ve yalnızca deneme 1 Gerçek Olumludur: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

4
Model uydurma / eğitim ve validasyon için kullanılan örnek verilerin oranının hesaplanması
Verileri tahmin etmek için kullanmayı planladığım bir örnek boyut "N" sağladı. Verileri alt bölümlere ayırmanın bazı yolları nelerdir? Bunun siyah-beyaz bir cevabı olmadığını biliyorum, ama bazı "başparmak kuralları" veya genellikle kullanılan oranları bilmek ilginç olurdu. Üniversitemizden biliyorum, profesörlerimizden biri eskiden% 60 model söyler ve% 40 geçer.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.