«hypothesis-testing» etiketlenmiş sorular

Hipotez testi, verilerin rastgele dalgalanmaların bir etkisi olmaktan ziyade belirli bir hipotezle tutarsız olup olmadığını değerlendirir.

2
Optimum numune boyutuna ulaşılmadan önce A / B testini durdurmak neden yanlıştır?
Şirketimde A / B testlerinin sonuçlarını (web sitesi varyasyonlarında çalıştırılır) sunmaktan sorumluyum. Testi bir ay boyunca yürütüyoruz ve daha sonra, anlamlılığa ulaşana kadar (veya testi uzun süre çalıştırdıktan sonra önem kazanılmazsa vazgeçene kadar) p değerlerini düzenli aralıklarla kontrol ediyoruz, şimdi öğrendiğim bir şey yanlış bir uygulamadır . Bu uygulamayı şimdi …


3
Neden birkaç (hepsi değilse de) parametrik hipotez testi rastgele örnekleme yapar?
Z, t ve diğerleri gibi testler, verilerin rastgele bir örneklemeye dayandığını varsayar. Neden? İçsel geçerliliği dışsaldan çok daha fazla önemsediğim deneysel araştırma yaptığımı varsayalım. Yani, örneğim biraz önyargılı olabilirse, tamam, çünkü tüm popülasyonlar için hipotezi çıkarmamayı kabul ettim. Ve gruplama hala rastgele olacak, yani örnek katılımcıları rahatlık için seçeceğim, ancak …

5
Bir denemeye başlamadan önce örnek büyüklüğünü belirleme veya denemeyi süresiz olarak çalıştırma?
Yıllar önce istatistik okudum ve hepsini unuttum, bu yüzden bunlar belirli bir şeyden daha genel kavramsal sorular gibi görünebilir ama işte benim sorunum. Bir e-ticaret web sitesinde UX Tasarımcısı olarak çalışıyorum. Yıllar önce inşa edilen ve bundan şüphe etmeye başladığım bir A / B test çerçevemiz var. Tüm kararlarımızı verdiğimiz …

2
Seçilen yanlış-pozitif / yanlış-negatif hata oranlarını ve temel maliyet oranını titizlikle nasıl gerekçelendirebilirim?
bağlam Bir grup sosyal bilimci ve istatistikçi ( Benjamin vd., 2017 ) son zamanlarda, "istatistiksel anlamlılık" belirlemek için bir eşik olarak kullanılan tipik yanlış-pozitif oranın ( = .05) daha muhafazakar bir eşiğe ayarlanması gerektiğini önerdi ( = .005). Rakip bir sosyal bilimci ve istatistikçi grubu ( Lakens ve ark., 2018 …

2
Kaggle müsabakaları şans eseri mi kazanıldı?
Kaggle müsabakaları, kalıcı bir test setine göre son sıralamaları belirler. Bekletilen bir test seti bir örnektir; modellenen popülasyonu temsil etmeyebilir. Her sunum bir hipotez gibi olduğundan, rekabeti kazanan algoritma, toplam şans eseri, test setini diğerlerinden daha iyi eşleştirebilir. Başka bir deyişle, farklı bir test seti seçildiyse ve yarışma tekrarlandıysa, sıralama …


2
2 örnekli oran testi için lm kullanma
Bir süredir 2 örnek oranlı testler yapmak için doğrusal modeller kullanıyorum, ancak bunun tamamen doğru olmayabileceğini fark ettim. Binom ailesi + kimlik bağlantısı ile genelleştirilmiş doğrusal bir modelin kullanılmasının tam olarak ayrılmamış 2 örnek oranlı test sonuçları verdiği görülmektedir. Bununla birlikte, doğrusal bir model (veya gaussian ailesiyle glm) kullanmak biraz …

1
Lojistik regresyonda uyum iyiliği testi; hangi 'uygun' testi yapmak istiyoruz?
Soruya ve cevaplarına atıfta bulunuyorum: Lojistik regresyondan geliştirilen modellerin tahmin yeteneği nasıl karşılaştırılır? @Clark Chong ve @Frank Harrell tarafından cevaplar / yorumlar. ve Hosmer-Lemeshow testinde serbestlik dereceleriχ2χ2\chi^2 ve yorumlar. Ben kağıt okuma var Medicine, Vol DW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, "lojistik regresyon modeli için iyilik-of-fit testlerin …

1
'Hipotez testi' ve 'model seçimi' arasındaki fark nedir?
Literatürde, her iki terim de genellikle eşanlamlı veya dokunmuş olarak kullanılır. Şimdi her iki terim arasında net bir ayrım bulmaya çalışıyorum. Benim bakış açımdan, bir hipotez genellikle bir model aracılığıyla ifade edilir. Dolayısıyla, sıfır ile alternatif hipotezi karşılaştırsak bile, bakış açımdan model seçimi yapıyoruz. Birisi bana bu ayrımın sezgisel bir …

5
Çok sayıda veri noktasındaki değerlerin gösterimi nasıl yapılır?
Çok büyük bir veri setim var ve yaklaşık% 5 rasgele değerler eksik. Bu değişkenler birbiriyle ilişkilidir. Aşağıdaki örnek R veri kümesi sadece yapay korelasyonlu verilere sahip bir oyuncak örneğidir. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Bu dağılım neden tekdüze?
Bayesian istatistik testlerini araştırıyoruz ve garip (en azından benim için) bir fenomenle karşılaşıyoruz. Şu durumu düşünün: Hangi popülasyonun (A veya B) daha yüksek dönüşüm oranına sahip olduğunu ölçmek istiyoruz. Bir sağlık kontrolü için, , yani dönüşüm olasılığı her iki grupta da eşit. Bir binom modeli kullanarak yapay veriler , örneğinpbir= …

1
İki numunenin ortalamalarını karşılaştırmak için bir bootstrap testi nasıl yapılır?
Ben iki ağır çarpık örnekleri var ve t-istatistik kullanarak araçlarını karşılaştırmak için bootstrapping kullanmaya çalışıyorum. Bunu yapmak için doğru prosedür nedir? Kullandığım süreç Bunun normal olarak dağıtılmadığını bildiğimde, son adımda orijinal / gözlemlenen verilerin standart hatasını kullanmanın uygunluğu konusunda endişeliyim. İşte adımlarım: Bootstrap - yedekli rastgele örnek (N = 1000) …

1
Test istatistiği dağılımı bimodal ise, p değeri bir şey ifade ediyor mu?
P-değeri, sıfır hipotezinin doğru olduğu varsayılarak, en azından gözlemlendiği kadar aşırı bir test istatistiği elde etme olasılığı olarak tanımlanır. Diğer bir deyişle, Peki ya test istatistiği dağılımda bimodal ise? p değeri bu bağlamda bir şey ifade ediyor mu? Örneğin, ben R bazı bimodal verileri simüle edeceğim:P( X≥ t | 'H0)P(X≥t|H0)P( …

1
Gauss lineer modellerde F testi neden en güçlü?
Y= μ + σG,Y=μ+σGY=\mu+\sigma Gμμ\muWWWG,GGR,nRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu \in U\}U⊂WU⊂WU \subset Wf=ϕ(2logsupμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=ϕ(2log⁡supμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=\phi\left( 2\log \frac{\sup_{\mu \in W, \sigma>0} L(\mu, \sigma | y)}{\sup_{\mu \in U, \sigma>0} L(\mu, \sigma | y)} \right). Bu istatistiğin için en güçlü testi sağladığını nasıl (belki de olağandışı özel durumlar sonra)? Bu Neyman-Pearson teoreminden kaynaklanmaz, çünkü bu teorem, olasılık oranı testinin …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.