İstatistikler ve Büyük Veri hypothesis-testing

2

Optimum numune boyutuna ulaşılmadan önce A / B testini durdurmak neden yanlıştır?

Şirketimde A / B testlerinin sonuçlarını (web sitesi varyasyonlarında çalıştırılır) sunmaktan sorumluyum. Testi bir ay boyunca yürütüyoruz ve daha sonra, anlamlılığa ulaşana kadar (veya testi uzun süre çalıştırdıktan sonra önem kazanılmazsa vazgeçene kadar) p değerlerini düzenli aralıklarla kontrol ediyoruz, şimdi öğrendiğim bir şey yanlış bir uygulamadır . Bu uygulamayı şimdi …

13 hypothesis-testing statistical-significance bias ab-test optimal-stopping

8

Rastgele değişken nesil algoritmalarını test etme

Rastgele değişken üretim algoritmalarını test etmek için hangi yöntemler kullanılır?

12 algorithms hypothesis-testing random-variable random-generation

3

Neden birkaç (hepsi değilse de) parametrik hipotez testi rastgele örnekleme yapar?

Z, t ve diğerleri gibi testler, verilerin rastgele bir örneklemeye dayandığını varsayar. Neden? İçsel geçerliliği dışsaldan çok daha fazla önemsediğim deneysel araştırma yaptığımı varsayalım. Yani, örneğim biraz önyargılı olabilirse, tamam, çünkü tüm popülasyonlar için hipotezi çıkarmamayı kabul ettim. Ve gruplama hala rastgele olacak, yani örnek katılımcıları rahatlık için seçeceğim, ancak …

12 hypothesis-testing sampling parametric randomness

5

Bir denemeye başlamadan önce örnek büyüklüğünü belirleme veya denemeyi süresiz olarak çalıştırma?

Yıllar önce istatistik okudum ve hepsini unuttum, bu yüzden bunlar belirli bir şeyden daha genel kavramsal sorular gibi görünebilir ama işte benim sorunum. Bir e-ticaret web sitesinde UX Tasarımcısı olarak çalışıyorum. Yıllar önce inşa edilen ve bundan şüphe etmeye başladığım bir A / B test çerçevemiz var. Tüm kararlarımızı verdiğimiz …

12 hypothesis-testing sample-size sequential-analysis

2

Seçilen yanlış-pozitif / yanlış-negatif hata oranlarını ve temel maliyet oranını titizlikle nasıl gerekçelendirebilirim?

bağlam Bir grup sosyal bilimci ve istatistikçi ( Benjamin vd., 2017 ) son zamanlarda, "istatistiksel anlamlılık" belirlemek için bir eşik olarak kullanılan tipik yanlış-pozitif oranın ( = .05) daha muhafazakar bir eşiğe ayarlanması gerektiğini önerdi ( = .005). Rakip bir sosyal bilimci ve istatistikçi grubu ( Lakens ve ark., 2018 …

12 hypothesis-testing p-value power type-i-and-ii-errors

2

Kaggle müsabakaları şans eseri mi kazanıldı?

Kaggle müsabakaları, kalıcı bir test setine göre son sıralamaları belirler. Bekletilen bir test seti bir örnektir; modellenen popülasyonu temsil etmeyebilir. Her sunum bir hipotez gibi olduğundan, rekabeti kazanan algoritma, toplam şans eseri, test setini diğerlerinden daha iyi eşleştirebilir. Başka bir deyişle, farklı bir test seti seçildiyse ve yarışma tekrarlandıysa, sıralama …

12 machine-learning probability hypothesis-testing sample kaggle

1

Daha hızlı yakınsama oranı nedeniyle hipotez testi için kullanın ?

Varsayalım ki X_n iid ve 0 olan bir hipotez testi yapmak istiyorum. Büyük n'm var ve Merkezi Limit Teoremini kullanabilirim. Ayrıca bir test yapmak olabilir bu test eşdeğer olmalıdır 0, 0 fazla olan, yakınsayan ki-kare, nereye normale yaklaşır. Çünkü daha hızlı bir yakınsama oranı vardır, ben testi istatistik için o …

12 hypothesis-testing convergence delta-method

2

2 örnekli oran testi için lm kullanma

Bir süredir 2 örnek oranlı testler yapmak için doğrusal modeller kullanıyorum, ancak bunun tamamen doğru olmayabileceğini fark ettim. Binom ailesi + kimlik bağlantısı ile genelleştirilmiş doğrusal bir modelin kullanılmasının tam olarak ayrılmamış 2 örnek oranlı test sonuçları verdiği görülmektedir. Bununla birlikte, doğrusal bir model (veya gaussian ailesiyle glm) kullanmak biraz …

12 r hypothesis-testing generalized-linear-model proportion

1

Lojistik regresyonda uyum iyiliği testi; hangi 'uygun' testi yapmak istiyoruz?

Soruya ve cevaplarına atıfta bulunuyorum: Lojistik regresyondan geliştirilen modellerin tahmin yeteneği nasıl karşılaştırılır? @Clark Chong ve @Frank Harrell tarafından cevaplar / yorumlar. ve Hosmer-Lemeshow testinde serbestlik dereceleriχ2χ2\chi^2 ve yorumlar. Ben kağıt okuma var Medicine, Vol DW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, "lojistik regresyon modeli için iyilik-of-fit testlerin …

12 hypothesis-testing logistic predictive-models regression-strategies hosmer-lemeshow-test

1

'Hipotez testi' ve 'model seçimi' arasındaki fark nedir?

Literatürde, her iki terim de genellikle eşanlamlı veya dokunmuş olarak kullanılır. Şimdi her iki terim arasında net bir ayrım bulmaya çalışıyorum. Benim bakış açımdan, bir hipotez genellikle bir model aracılığıyla ifade edilir. Dolayısıyla, sıfır ile alternatif hipotezi karşılaştırsak bile, bakış açımdan model seçimi yapıyoruz. Birisi bana bu ayrımın sezgisel bir …

12 hypothesis-testing model-selection regression-strategies

5

Çok sayıda veri noktasındaki değerlerin gösterimi nasıl yapılır?

Çok büyük bir veri setim var ve yaklaşık% 5 rasgele değerler eksik. Bu değişkenler birbiriyle ilişkilidir. Aşağıdaki örnek R veri kümesi sadece yapay korelasyonlu verilere sahip bir oyuncak örneğidir. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

2

Bu dağılım neden tekdüze?

Bayesian istatistik testlerini araştırıyoruz ve garip (en azından benim için) bir fenomenle karşılaşıyoruz. Şu durumu düşünün: Hangi popülasyonun (A veya B) daha yüksek dönüşüm oranına sahip olduğunu ölçmek istiyoruz. Bir sağlık kontrolü için, , yani dönüşüm olasılığı her iki grupta da eşit. Bir binom modeli kullanarak yapay veriler , örneğinpbir= …

12 hypothesis-testing bayesian binomial python beta-distribution

1

İki numunenin ortalamalarını karşılaştırmak için bir bootstrap testi nasıl yapılır?

Ben iki ağır çarpık örnekleri var ve t-istatistik kullanarak araçlarını karşılaştırmak için bootstrapping kullanmaya çalışıyorum. Bunu yapmak için doğru prosedür nedir? Kullandığım süreç Bunun normal olarak dağıtılmadığını bildiğimde, son adımda orijinal / gözlemlenen verilerin standart hatasını kullanmanın uygunluğu konusunda endişeliyim. İşte adımlarım: Bootstrap - yedekli rastgele örnek (N = 1000) …

12 hypothesis-testing t-test bootstrap

1

Test istatistiği dağılımı bimodal ise, p değeri bir şey ifade ediyor mu?

P-değeri, sıfır hipotezinin doğru olduğu varsayılarak, en azından gözlemlendiği kadar aşırı bir test istatistiği elde etme olasılığı olarak tanımlanır. Diğer bir deyişle, Peki ya test istatistiği dağılımda bimodal ise? p değeri bu bağlamda bir şey ifade ediyor mu? Örneğin, ben R bazı bimodal verileri simüle edeceğim:P( X≥ t | 'H0)P(X≥t|H0)P( …

12 hypothesis-testing statistical-significance p-value descriptive-statistics bimodal

1

Gauss lineer modellerde F testi neden en güçlü?

Y= μ + σG,Y=μ+σGY=\mu+\sigma Gμμ\muWWWG,GGR,nRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu \in U\}U⊂WU⊂WU \subset Wf=ϕ(2logsupμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=ϕ(2log⁡supμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=\phi\left( 2\log \frac{\sup_{\mu \in W, \sigma>0} L(\mu, \sigma | y)}{\sup_{\mu \in U, \sigma>0} L(\mu, \sigma | y)} \right). Bu istatistiğin için en güçlü testi sağladığını nasıl (belki de olağandışı özel durumlar sonra)? Bu Neyman-Pearson teoreminden kaynaklanmaz, çünkü bu teorem, olasılık oranı testinin …

12 hypothesis-testing normal-distribution linear-model power likelihood-ratio

«hypothesis-testing» etiketlenmiş sorular