«proportion» etiketlenmiş sorular

Oran, belirli bir türdeki bir toplamın kesiridir, ya (i) toplam sayımdan bir tür şeyin sayımı olarak ya da (ii) sürekli bir değişkenin bir bileşeni olarak.

3
Bir örnek: ikili sonuç için glmnet kullanarak LASSO regresyonu
Ben kullanımı ile serpmek başlıyorum glmnetile LASSO Regresyon ilgi benim sonuç dikotom olduğunu. Aşağıda küçük bir sahte veri çerçevesi oluşturdum: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

2
Ki kare testi ile eşit oranlarda test arasındaki ilişki nedir?
Diyelim ki dört, birbirini dışlayan özelliklere sahip üç popülasyonum var. Her popülasyondan rastgele örnekler alıyorum ve ölçtüğüm özellikler için bir çapraz tablo veya frekans tablosu yapıyorum. Bunu söylerken doğru mu: Eğer popülasyonlar ve özellikler arasında bir ilişki olup olmadığını test etmek istersem (örneğin, bir popülasyonun özelliklerden birinin frekansının daha yüksek …

4
Tam iki örnek oranlı binom testi R (ve bazı garip p-değerleri)
Aşağıdaki soruyu çözmeye çalışıyorum: A oyuncusu 25 maç arasından 17 kazanırken B oyuncusu 20 üzerinden 8 kazandı - her iki oran arasında da önemli bir fark var mı? Akla gelen R'de yapılacak şey şudur: > prop.test(c(17,8),c(25,20),correct=FALSE) 2-sample test for equality of proportions without continuity correction data: c(17, 8) out of …


3
A / B testi için numune boyutunu güvenle belirleme
A / B test aracı oluşturmak isteyen bir yazılım mühendisiyim . Sağlam bir istatistik geçmişim yok ama son birkaç gündür biraz okuma yapıyorum. Burada açıklanan metodolojiyi takip ediyorum ve aşağıdaki ilgili noktaları özetleyeceğim. Araç, tasarımcıların ve etki alanı uzmanlarının bir web sitesini belirli bir URL’de gelen trafiği iki veya daha …

4
Uç durumlarda hassaslık ve geri çağırma için doğru değerler nelerdir?
Hassasiyet şu şekilde tanımlanır: p = true positives / (true positives + false positives) Gibi, bu doğru mu true positivesve false positiveshassas 1 yaklaşır yaklaşım 0? Hatırlama için aynı soru: r = true positives / (true positives + false negatives) Şu anda bu değerleri hesaplamam gereken bir istatistiksel test uyguluyorum …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
Ne Düzeyde bir olan
ARKA PLAN: Güvenle atlayın - referans için ve soruyu meşrulaştırmak için burada. Bu makalenin açılışında şunlar yazıyor: "Karl Pearson'un ünlü ki-kare beklenmedik durum testi, Normal dağılımına dayanarak z istatistiği adı verilen başka bir istatistikten türetilmiştir. en basit sürümlerinin, χ2χ2\chi^2eşdeğer z testleriyle matematiksel olarak aynı olduğu gösterilebilir. Testler aynı sonucu verir. …


1
Doğrusal regresyonda bağımsız değişkenler olarak bire bir oranların yorumlanması
Ben kategorik değişkenler kavramı ve kollearlık önlemek için temel olarak bir seviye sığdırmak için izin veren ilgili kukla değişken kodlama aşina. Bu tür modellerden parametre tahminlerinin nasıl yorumlanacağına da aşinayım: Temel kategoriye göre kategorik öngörücünün belirli bir donatılmış düzeyi için sonuçta öngörülen değişiklik. Emin olmadığım, bir toplamı oluşturan bağımsız değişkenler …

1
"Sayım oranları" ile "sürekli oranlar" arasındaki fark nedir?
Başka bir soru üzerine yapılan bir yorumda, tartışılan konunun "sayım oranları" veya "sürekli oranlar" olup olmadığı netleştirildi ve bir takip, farkın kritik bilgi olduğunu (lojistik / binom ve beta regresyon konusuna) gösterdi. İkisi arasındaki ayrım nedir ve ayrım nerede önemlidir? "Sürekli oranlar" ile çalışırken "sürekli oranlar" ile çalışırken akılda tutulması …

2
2 örnekli oran testi için lm kullanma
Bir süredir 2 örnek oranlı testler yapmak için doğrusal modeller kullanıyorum, ancak bunun tamamen doğru olmayabileceğini fark ettim. Binom ailesi + kimlik bağlantısı ile genelleştirilmiş doğrusal bir modelin kullanılmasının tam olarak ayrılmamış 2 örnek oranlı test sonuçları verdiği görülmektedir. Bununla birlikte, doğrusal bir model (veya gaussian ailesiyle glm) kullanmak biraz …

1
Bağımsız bir değişkenken oranları dönüştürmenin en uygun yolu nedir?
Bu sorunu anladığımı sanıyordum, ama şimdi tam olarak emin değilim ve devam etmeden önce başkalarıyla görüşmek istiyorum. İki değişkenim var Xve Y. YR, bir orandır ve 0 ve 1 ile sınırlı değildir ve genellikle normal olarak dağıtılır. Xbir orandır ve 0 ve 1 ile sınırlıdır (0,0 ila 0,6 arasında çalışır). …

5
Çok sayıda veri noktasındaki değerlerin gösterimi nasıl yapılır?
Çok büyük bir veri setim var ve yaklaşık% 5 rasgele değerler eksik. Bu değişkenler birbiriyle ilişkilidir. Aşağıdaki örnek R veri kümesi sadece yapay korelasyonlu verilere sahip bir oyuncak örneğidir. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Matematikçi olmayanlar için Clopper-Pearson
Herkes bana Clopper-Pearson CI'nin ötesindeki sezgiyi oranlar için açıklayabilir mi diye merak ediyordum. Bildiğim kadarıyla, her CI içinde bir varyans içerir. Bununla birlikte, oranlar için, oranım 0 veya 1 olsa bile (% 0 veya% 100), Clopper-Pearson CI hesaplanabilir. Formüllere bakmayı denedim ve Binom dağılımının yüzdelikleri ile bir şey olduğunu anlıyorum …

2
vs -test
Çok saygın (popüler) bir bilim dergisinde (Alman Başbakanı, 02/2013, s.36) ilginç bir deney hakkında (ne yazık ki kaynaksız) okudum. Dikkatimi çekti çünkü sezgisel olarak sonucun öneminden şüphe ettim, ancak sağlanan bilgiler istatistiksel testi çoğaltmak için yeterliydi. Araştırmacılar soğuk havada soğuk almanın soğuk algınlığı olasılığını artırıp artırmadığını merak ettiler. Böylece 180 …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.