«normality-assumption» etiketlenmiş sorular

Birçok istatistiksel yöntem, verilerin normal olarak dağıtıldığını varsayar. Normallik varsayımı ve testi veya * mülkiyet * olarak normallik hakkında sorular için bu etiketi kullanın. Normal dağılım hakkındaki sorularınız için [normal dağılım] kullanın.

2
Doğada bir yerlerde normal eğrinin şeklini görebilir miyiz?
Doğada bazı fenomenlerin normal dağılıma sahip olup olmadığını bilmek istemiyorum, ama normal eğri şeklini bir yerde görüp göremeyeceğimiz gibi, örneğin Galton kutusunda. Wikipedia'dan bu şekle bakın . Birçok matematiksel şeklin veya eğrinin doğada doğrudan görüldüğüne dikkat edin, örneğin altın ortalama ve logaritmik spiral salyangozlarda bulunabilir. İlk naif cevap, bükülmemiş tepelerin …

4
Normal rv'nin basıklık ve çarpıklığını arttıracak dönüşüm
gözlemlerinin normal olarak dağıtıldığı gerçeğine dayanan bir algoritma üzerinde çalışıyorum ve algoritmanın bu varsayımın sağlamlığını ampirik olarak test etmek istiyorum.YYY Bunu yapmak için , normalliğini aşamalı olarak bozacak bir dizi dönüşüm . Örneğin s normal sahip oldukları çarpıklık ve basıklık , ve progresif olarak artırmaya dönüşümün bir dizi bulmaya iyi …

4
Uç durumlarda hassaslık ve geri çağırma için doğru değerler nelerdir?
Hassasiyet şu şekilde tanımlanır: p = true positives / (true positives + false positives) Gibi, bu doğru mu true positivesve false positiveshassas 1 yaklaşır yaklaşım 0? Hatırlama için aynı soru: r = true positives / (true positives + false negatives) Şu anda bu değerleri hesaplamam gereken bir istatistiksel test uyguluyorum …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

3
Merkezi limit teoremi için büyük örneklem büyüklüğünün gerekli olduğu dağıtım örneği
Bazı kitaplar, merkezi sınır teoreminin için iyi bir yaklaşım sağlayabilmesi için 30 veya daha büyük bir örneklem boyutunun gerekli olduğunu belirtir . X¯X¯\bar{X} Bunun tüm dağıtımlar için yeterli olmadığını biliyorum. Büyük örneklem büyüklüğünde (belki 100 veya 1000 veya daha yüksek) bile, örnek ortalamanın dağılımının hala oldukça çarpık olduğu bazı dağılım …

2
Veriler normal olarak dağıtılmadığında iki grup arasındaki farklar nasıl test edilir?
Tüm biyolojik detayları ve deneyleri ortadan kaldıracağım ve sadece eldeki problemi ve istatistiksel olarak yaptığım şeyi alıntılayacağım. Doğru olup olmadığını ve nasıl devam edileceğini bilmek istiyorum. Veriler (veya açıklamam) yeterince net değilse, düzenleyerek daha iyi açıklamaya çalışacağım. Varsayalım ki iki grup / gözlem var, X ve Y, ve N y …

4
Bir aykırı değer için Box ve Whisker Plot tanımının temeli nedir?
Bir Kutu ve Bıyık grafiği için bir aykırı standart tanımı aralığının dışındaki noktalardır ; burada ve ilk çeyrek ve verinin üçüncü çeyreğidir.{Q1−1.5IQR,Q3+1.5IQR}{Q1−1.5IQR,Q3+1.5IQR}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}IQR=Q3−Q1IQR=Q3−Q1IQR= Q3-Q1Q1Q1Q1Q3Q3Q3 Bu tanımın temeli nedir? Çok sayıda nokta ile mükemmel bir normal dağılım bile aykırı değerlere geri döner. Örneğin, diziyle başladığınızı varsayalım: xseq<-seq(1-.5^1/4000,.5^1/4000, by = -.00025) Bu dizi …

1
Neden hatanın normal olarak dağıtıldığını varsayıyoruz?
Hatayı modellerken neden Gauss varsayımını kullandığımızı merak ediyorum. In Stanford ML kursu Prof. Ng iki şekilde temelde bunu anlatır: Matematiksel olarak uygundur. (En Küçük Kareler montajı ile ilgilidir ve psödoinverse ile çözülmesi kolaydır) Merkezi Limit Teoremi nedeniyle, süreci etkileyen çok sayıda temel olgu olduğunu varsayabiliriz ve bu bireysel hataların toplamı …

2
F-testi normallik varsayımı için neden bu kadar hassas?
Varyans farkı için F testi neden büyük için bile normal dağılım varsayımına karşı bu kadar hassastır ?NNN Web'de arama yapmaya çalıştım ve kütüphaneyi ziyaret ettim, ancak hiçbiri iyi cevap vermedi. Testin normal dağılım varsayımının ihlali için çok hassas olduğunu söylüyor, ancak nedenini anlamıyorum. Bunun için iyi bir cevabı olan var …

5
Numune ortalamalarının örnekleme dağılımı popülasyon ortalamalarına nasıl yaklaşıyor?
İstatistikleri öğrenmeye çalışıyorum çünkü doğru anlamadığım takdirde bazı şeyleri öğrenmemi yasaklayan o kadar yaygın olduğunu düşünüyorum. Örnek araçların örnekleme dağılımı kavramını anlamakta güçlük çekiyorum. Bazı kitapların ve sitelerin nasıl açıkladığını anlayamıyorum. Sanırım bir anlayışım var ama doğru olup olmadığından emin değilim. Aşağıda bunu anlama girişimim var. Normal bir dağılım gösteren …

2
Tekrarlanan önlemler ANOVA: normallik varsayımı nedir?
ANOVA'nın tekrarlanan ölçümlerinde normallik varsayımı hakkında kafam karıştı. Özellikle, ne tür bir normalliğin tam olarak karşılanması gerektiğini merak ediyorum. Literatürü ve CV hakkındaki cevapları okurken, bu varsayımın üç ayrı ifadesine rastladım. Her (tekrarlanan) koşul içindeki bağımlı değişken normal şekilde dağıtılmalıdır. RANOVA'nın ANOVA ve küresellik ile aynı varsayımlara sahip olduğu sıklıkla …

1
R: doğrusal model kalıntılarının test normu - kalan kalıntılar
Normalliği kontrol etmek için doğrusal bir modelin kalıntıları üzerinde bir Shapiro Wilk'un W testi ve Kolmogorov-Smirnov testi yapmak istiyorum. Sadece bunun için hangi artıkların kullanılması gerektiğini merak ediyordum - ham artıklar, Pearson kalıntıları, öğrenci kalıntıları veya standart kalıntılar? Shapiro-Wilk'un W testi için, ham & Pearson kalıntıları için sonuçlar aynıdır, ancak …

1
GBM kullanarak GBM paketi ve Caret
Model kullanarak ayar yapıyordum caret, ancak gbmpaketi kullanarak modeli yeniden çalıştırıyorum . Anladığım kadarıyla caretpaketin kullandığı gbmve çıktı aynı olmalı. Bununla birlikte, sadece hızlı bir test çalıştırması data(iris), değerlendirme metriği olarak RMSE ve R ^ 2 kullanılarak modelde yaklaşık% 5 tutarsızlık gösterir. Kısmi bağımlılık grafiklerini kullanmak için en iyi model …

2
ANOVA'da normallik varsayımından ayrılma: basıklık veya çarpıklık daha önemli mi?
Kutner ve ark. ANOVA modellerinin normallik varsayımından ayrılma ile ilgili olarak şunları ifade eder: Hata dağılımının basıklığı (normal bir dağılımdan daha fazla veya daha az zirve) çıkarımlar üzerindeki etkiler açısından dağılımın çarpıklığından daha önemlidir . Bu ifadeden biraz şaşkınım ve kitapta veya çevrimiçi olarak ilgili herhangi bir bilgi bulmayı başaramadım. …

1
Neden her zaman bootstrap CI kullanmıyorsunuz?
Bootstrap CI'lerin (ve bartikülerdeki BCa) normal olarak dağıtılan verilerde nasıl performans gösterdiğini merak ediyordum. Çeşitli dağıtım türlerindeki performanslarını inceleyen çok fazla iş var gibi görünüyor, ancak normal olarak dağıtılan veriler üzerinde hiçbir şey bulamadı. İlk önce çalışmak bariz bir şey gibi göründüğünden, sanırım kağıtlar çok eski. R önyükleme paketini kullanarak …

5
Çok sayıda veri noktasındaki değerlerin gösterimi nasıl yapılır?
Çok büyük bir veri setim var ve yaklaşık% 5 rasgele değerler eksik. Bu değişkenler birbiriyle ilişkilidir. Aşağıdaki örnek R veri kümesi sadece yapay korelasyonlu verilere sahip bir oyuncak örneğidir. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.