«goodness-of-fit» etiketlenmiş sorular

Uyum iyiliği testleri, rastgele bir numunenin belirli bir dağılımdan geldiğini varsaymanın makul olup olmadığını gösterir.

1
Sıfır hipotezi altında değiştirilebilir örneklerin ardındaki sezgi nedir?
Permütasyon testleri (randomizasyon testi, yeniden randomizasyon testi veya kesin test olarak da adlandırılır) çok faydalıdır ve örneğin normal dağıtım varsayımı t-testkarşılanmadığında ve değerlerin parametrik olmayan test Mann-Whitney-U-test, daha fazla bilginin kaybolmasına neden olur. Bununla birlikte, bu tür bir test kullanılırken bir ve sadece bir varsayım göz ardı edilmemelidir, örneklerin sıfır …
16 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 


1
Bir dağıtımın bir güç yasasına uygun olup olmadığı nasıl test edilir?
Kaç kullanıcının kaç soru gönderdiğine dair verilerim var. Örneğin, [UserCount, QuestionCount] [2, 100] [9, 10] [3, 80] ... ... Bu, 2 kullanıcının her birinin 100 soru gönderdiğini, 9 kullanıcının her birinin 10 soru gönderdiğini vb. Peki, UserCount, QuestionCountdağıtımın bir güç yasasına uygun olup olmadığını nasıl belirleyebilirim ? PoweRlaw paketini buldum …

1
Lojistik regresyon modelinin değerlendirilmesi
Lojistik bir model üzerinde çalışıyorum ve sonuçları değerlendirmede bazı zorluklar yaşıyorum. Modelim bir binom logit. Açıklayıcı değişkenlerim: 15 seviyeli kategorik bir değişken, iki değişkenli ve 2 sürekli değişken. N harfim büyük> 8000. Firmaların yatırım yapma kararlarını modellemeye çalışıyorum. Bağımlı değişken yatırımdır (evet / hayır), 15 seviye değişkenleri yöneticiler tarafından bildirilen …

2
Bir veri örneğinin Gamma dağılımı ailesine uyup uymadığını nasıl test edebilirim?
Sürekli rasgele bir değişken X'ten üretilen bir veri örneğim var. Ve R kullanarak çizilen histogramdan, X'in dağılımının belirli bir Gamma dağılımına uyduğunu tahmin ediyorum. Ama bu Gamma dağılımının kesin parametrelerini bilmiyorum. Sorum X'in dağılımının bir Gamma dağılımı ailesine ait olup olmadığını nasıl test edeceğim? Kolmogorov-Smirnov testi, Anderson-Darling testi ve benzeri …

2
Lojistik regresyon modellerinin değerlendirilmesi
Bu soru, bir lojistik modelin yeterince iyi olup olmadığına nasıl karar verileceğime dair gerçek karışıklığımdan kaynaklanıyor. Bağımlı bir değişken olarak oluşturulduktan iki yıl sonra bireysel projenin durumunu kullanan modellerim var. Sonuç başarılı (1) ya da değil (0). Çiftlerin oluşumu sırasında ölçülen bağımsız değişkenlerim var. Amacım, varsaydığım bir değişkenin çiftlerin başarısını …

5
Elo derecelendirmesinin veya Sayfa sıralamasının kümem için bir anlamı olduğunu nasıl kanıtlayabilirim?
Bir takım oyuncularım var. Birbirlerine karşı oynarlar (çift olarak). Çift oyuncular rastgele seçilir. Herhangi bir oyunda, bir oyuncu kazanır ve diğeri kaybeder. Oyuncular birbirleriyle sınırlı sayıda oyun oynarlar (bazı oyuncular daha fazla oyun, bazıları daha az oyun oynar). Yani verilerim var (kim kime ve kaç kez kazanır). Şimdi her oyuncunun …

1
Kement için LARS ve koordinat inişi
L1 düzenli lineer regresyonu takmak için koordinat inişine karşı LARS [1] kullanmanın avantajları ve dezavantajları nelerdir? Ben esas olarak performans yönleriyle ilgileniyorum (sorunlarım Nyüzbinlerce ve p<20'de olma eğilimindedir ). Ancak, diğer görüşler de takdir edilecektir. edit: Soruyu gönderdiğimden beri, chl, Friedman ve arkadaşları tarafından koordinat inişinin diğer yöntemlerden önemli ölçüde …


1
Beklenen değeri
R 2 a d j u s t e d düzenlemesiyle ilgili olarak bu metnin ilk sayfasının altında yapılan ifadeyi merak ediyorumR2adjustedRadjusted2R^2_\mathrm{adjusted} R2adjusted=1−(1−R2)(n−1n−m−1).Radjusted2=1−(1−R2)(n−1n−m−1).R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right). Metin şunu belirtmektedir: Ayarlamanın mantığı şöyledir: sıradan çoklu regresyonda, rastgele bir tahminci yanıtın varyasyonunun ortalama oranını açıklar , böylece rastgele tahmin ediciler birlikte ortalama olarak yanıtın …

1
R'de regresyon spline'ları ile Lojistik Regresyon
İngiltere'de kafa travması veri tabanındaki retrospektif verilere dayanan bir lojistik regresyon modeli geliştiriyorum. Kilit sonuç 30 günlük mortalite ("Hayatta Kalma" ölçüsü olarak ifade edilir). Önceki çalışmalarda sonuç üzerinde önemli etkisi olduğuna dair kanıtları yayınlanmış diğer önlemler şunlardır: Year - Year of procedure = 1994-2013 Age - Age of patient = …

4
Çok büyük numune boyutları için uygunluk
Her gün çok büyük kategorik veri örnekleri (> 1.000.000) topluyorum ve veri toplamadaki hataları tespit etmek için verilerin günler arasında "önemli ölçüde" farklı göründüğünü görmek istiyorum. Uygun bir test (özellikle bir G-testi) kullanmanın bunun için iyi bir seçim olacağını düşündüm. Beklenen dağılım, bir önceki günün dağılımı ile verilir. Ancak, örnek …

3
Benim modeli tanı metrik (dayalı herhangi iyi, var
Modelimi taktım ve bunun iyi olup olmadığını anlamaya çalışıyorum. Değerlendirmek için önerilen metrikleri hesapladım ( / AUC / doğruluk / tahmin hatası / vb) ancak bunları nasıl yorumlayacağımı bilmiyorum. Kısacası, modelimin metriğe göre iyi olup olmadığını nasıl anlarım? BirR2R2R^2R2R2R^2 yeterli (örneğin) 0,6 beni çıkarımlar veya baz bilimsel / iş kararları …

2
Kolmogorov – Smirnov testi: p-değeri ve ks-test istatistiği örneklem büyüklüğü arttıkça azalır
P-değerleri ve ks-test istatistikleri, artan örneklem büyüklüğü ile neden azalıyor? Bu Python kodunu örnek olarak alalım: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) Sonuçlar: Ks_2sampResult(statistic=0.30000000000000004, pvalue=0.67507815371659508) Ks_2sampResult(statistic=0.080000000000000071, …

1
Sıfır şişirilmiş Poisson veya sıfır şişirilmiş negatif binom için “sapma” ölçüsü mü?
D = 2 * (doymuş modelin log-olasılığı eksi modelin log-olasılığı) olarak tanımlanan ölçek sapması genellikle GLM modellerinde uyum iyiliğinin bir ölçüsü olarak kullanılır. [D (null model) - D (takılı model)] / D (null model) olarak tanımlanan açıklanan yüzde sapma, bazen doğrusal regresyonun R-karesi için GLM analogu olarak da kullanılır. ZIP …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.