«sample-size» etiketlenmiş sorular

Bu etiket çok belirsiz. Soru örnek büyüklüğü ile ilgili olduğunda ve aşağıdakilerden HİÇBİRİ daha uygun olduğunda kullanın: [küçük örnek], [büyük veri], [güç analizi], [güç], [yetersiz belirlenmiş] veya [dengesiz sınıflar].

4
Belirli bir tahmin tekniği ve parametreleri için bir örnek ne kadar büyük olmalıdır?
Belirli bir sayıda parametreye sahip bir modeli tahmin etmek için bir numunenin ne kadar büyük olması gerektiğini anlatmanın bir kuralı veya hatta herhangi bir yolu var mı? Yani, örneğin, 5 parametreli en küçük kareler regresyonunu tahmin etmek istersem örnek ne kadar büyük olmalı? Hangi tahmin tekniğini kullandığınız (örn. Maksimum olasılık, …

1
Neden geniş bir K seçeneği çapraz doğrulama puanımı düşürüyor?
İle oynamak Boston Konut Verisetinin ve RandomForestRegressor(w / varsayılan parametreleri) Garip bir şey fark, scikit-öğrenme: ortalama çapraz doğrulama puanı azaldı My çapraz doğrulama stratejisi olarak oldu şu 10 öteye kıvrımları sayısını artırdı olarak: cv_met = ShuffleSplit(n_splits=k, test_size=1/k) scores = cross_val_score(est, X, y, cv=cv_met) ... neredeydi num_cvs. Ben set test_sizeiçin 1/num_cvsk …

1
Önyükleme bu sürekli veriler için uygun mu?
Ben tam bir acemiyim :) Yaklaşık 745.000 kişilik bir nüfustan 10.000 örnek büyüklüğünde bir çalışma yapıyorum. Her örnek bir "yüzde benzerliği" temsil eder. Numunelerin büyük çoğunluğu% 97-98 civarındadır, ancak birkaçı% 60 ile% 90 arasındadır, yani dağılım ciddi şekilde çarpıktır. Sonuçların yaklaşık% 0.6'sı% 0'dır, ancak bunlar numuneden ayrı olarak işlenecektir. Tüm …

4
Bir çalışmanın aşırı güç alması ne anlama geliyor?
Bir çalışmanın aşırı güç alması ne anlama geliyor? Benim izlenimim, örnek boyutlarınızın o kadar büyük olduğu anlamına gelir ki minik etki boyutlarını tespit etme gücüne sahipsiniz. Bu etki büyüklükleri belki de o kadar küçüktür ki, örnekleme işlemindeki hafif yanlılıklardan kaynaklanma olasılıkları değişkenler arasındaki (mutlaka doğrudan değil) nedensel bağlantıdan daha olasıdır. …

1
Hangi reklam grubundan hangisinin en yüksek tıklama oranına sahip olduğunu belirlemek için gerekli örnek boyutu
Ticarete göre bir yazılım tasarımcısıyım ve bir müşteri için bir proje üzerinde çalışıyorum ve analizimin istatistiksel olarak sağlam olduğundan emin olmak istiyorum. Aşağıdakileri düşünün: n reklamımız var (n <10) ve sadece hangi reklamın en iyi performansı gösterdiğini bilmek istiyoruz. Reklam sunucumuz bu reklamlardan birini rastgele yayınlayacak. Başarı, bir kullanıcının reklamı …

4
Tek değişkenli lojistik regresyon için örnek büyüklüğü hesaplaması
Bir denek kohortunun ameliyat sırasında ölçülen tek bir sürekli değişkene sahip olacağı ve daha sonra iki yıl sonra fonksiyonel sonuç veya bozulmuş sonuç olarak sınıflandırılacak bir çalışma için gereken örneklem büyüklüğü nasıl hesaplanır. Bu ölçümün kötü sonucu tahmin edip edemeyeceğini görmek istiyoruz. Bir noktada, sürekli değişkente, bozulmuş sonucun olasılığını azaltmak …

1
R / mgcv: te () ve ti () tensör ürünleri neden farklı yüzeyler üretir?
mgcvİçin paket Rtensör ürün etkileşimleri uydurma için iki işlevi vardır: te()ve ti(). İkisi arasındaki temel işbölümünü anlıyorum (doğrusal olmayan bir etkileşime uymak ve bu etkileşimi ana etkilere ve etkileşime ayırmak). Anlamadığım şey neden te(x1, x2)ve ti(x1) + ti(x2) + ti(x1, x2)(biraz) farklı sonuçlar üretebilir. MWE (uyarlanmıştır ?ti): require(mgcv) test1 <- …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
SurveyMonkey rastgele olmayan bir örnek aldığınız gerçeğini yoksayar mı?
SurveyMonkey, nüfus büyüklüğünüze bağlı olarak belirli bir hata veya güven aralığı aralığı için hangi örnek boyutuna ihtiyacınız olduğunu anlamanız için adımlar ve bir grafik içerir. SurveyMonkey örnek boyutu Bu grafik, yalnızca ankete yanıt vermek için rahatsız olan insanları aldığınız için rastgele bir örnek alamayacağınız gerçeğini görmezden geliyor mu? Bu soru …

2
Hassasiyet tabanlı (yani ters-varyans) ağırlıklandırma meta analize entegre midir?
Hassasiyet temelli ağırlıklandırma meta analizin merkezinde midir? Borenstein ve diğ. (2009) meta-analizin mümkün olması için gerekli olan tek şey olduğunu yazınız: Çalışmalar, tek bir sayı olarak ifade edilebilecek bir nokta tahmini bildirmektedir. Bu nokta tahmini için varyans hesaplanabilir. (2) 'nin neden kesinlikle gerekli olduğu hemen belli değil. Ancak, aslında, geniş …

2
Küçük örneklem büyüklüğü verileri için eğitim, çapraz doğrulama ve test seti boyutları nasıl seçilir?
Küçük bir örnek boyutum olduğunu varsayalım, örneğin N = 100 ve iki sınıf. Makine öğrenimi için eğitim, çapraz doğrulama ve test seti boyutlarını nasıl seçmeliyim? Sezgisel olarak seçerdim Eğitim seti boyutu 50 Çapraz doğrulama seti boyutu 25 ve Boyutu 25 olarak test edin. Ama muhtemelen bu az ya da çok …

2
Tüm popülasyondan elde edilen veriler olduğunda güven aralıklarını hesaplamak ve hipotezleri test etmek mantıklı mıdır?
Tüm popülasyondaki veriler mevcut olduğunda güven aralıklarını hesaplamak ve hipotezleri test etmek mantıklı mıdır? Bence cevap hayır, çünkü parametrelerin gerçek değerlerini doğru bir şekilde hesaplayabiliriz. Ancak, orijinal popülasyondan yukarıda belirtilen teknikleri kullanmamıza izin veren maksimum veri oranı nedir?

3
Sıfır hipotezi
H0:p=0H0:p=0H_0: p = 0 , vs ile binom verilerinden tek bir örnek için bir güç analizi yapmak istiyorum H1:p=0.001H1:p=0.001H_1: p = 0.001, burada ppp popülasyondaki başarıların oranıdır. Eğer 0&lt;p&lt;10&lt;p&lt;10 < p <1 , bir binom normal yaklaşım ya kullanabilir veya olabilir χ2χ2\chi^2 -testi, fakat p=0p=0p =0 , bu iki başarısız …

1
Anova () ve drop1 () neden GLMM'ler için farklı cevaplar verdi?
Formun bir GLMM var: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kullandığımda , araç paketinden veya drop1(model, test="Chi")kullandığımdan farklı sonuçlar alıyorum . Bu son ikisi aynı cevapları verir.Anova(model, type="III")summary(model) Bir grup uydurma veri kullanarak, bu iki yöntemin normalde farklı olmadığını gördüm. Dengeli doğrusal …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
Standart hata (SE) kullanmadan alternatif huni grafiği
Meta analizimi göndermeden önce, heterojenliği ve yayın yanlılığını test etmek için bir huni grafiği yapmak istiyorum. Her çalışmadan -1 ile +1 arasında değerler alan birleştirilmiş efekt boyutu ve etki boyutları var. Her çalışmadan hastalar ve kontroller için n1, n2 örnek boyutlarına sahibim. Standart hatayı (SE) hesaplayamadığım için Egger'in gerilemesini yapamıyorum. …

2
Rastgele efekt modelinde küme başına minimum örnek boyutu
Rastgele bir etki modelinde küme başına gözlem sayısının mantıklı bir yanı var mı? 1,500 örnek büyüklüğünde, değiştirilebilir rasgele etki olarak modellenmiş 700 küme var. Daha az ama daha büyük kümeler oluşturmak için kümeleri birleştirme seçeneğim var. Her küme için rastgele etkiyi tahmin etmede anlamlı sonuçlar elde etmek için küme başına …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.