İstatistikler ve Büyük Veri goodness-of-fit

1

Sıfır hipotezi altında değiştirilebilir örneklerin ardındaki sezgi nedir?

Permütasyon testleri (randomizasyon testi, yeniden randomizasyon testi veya kesin test olarak da adlandırılır) çok faydalıdır ve örneğin normal dağıtım varsayımı t-testkarşılanmadığında ve değerlerin parametrik olmayan test Mann-Whitney-U-test, daha fazla bilginin kaybolmasına neden olur. Bununla birlikte, bu tür bir test kullanılırken bir ve sadece bir varsayım göz ardı edilmemelidir, örneklerin sıfır …

16 hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

1

Tek kuyruklu Kolmogorov-Smirnov testi yapmak mantıklı mı?

Tek kuyruklu KS testi yapmak anlamlı ve mümkün mü? Böyle bir testin geçersiz hipotezi ne olurdu? Yoksa KS testi doğal olarak iki kuyruklu bir test mi? D' nin dağılımını anlamama yardımcı olan bir cevaptan faydalanacağım (Massey'nin 1951 makalesinde çalışıyorum ve örneğin ve D - mutlak olmayan değerin farklılıklarının en üst …

15 hypothesis-testing goodness-of-fit kolmogorov-smirnov

1

Bir dağıtımın bir güç yasasına uygun olup olmadığı nasıl test edilir?

Kaç kullanıcının kaç soru gönderdiğine dair verilerim var. Örneğin, [UserCount, QuestionCount] [2, 100] [9, 10] [3, 80] ... ... Bu, 2 kullanıcının her birinin 100 soru gönderdiğini, 9 kullanıcının her birinin 10 soru gönderdiğini vb. Peki, UserCount, QuestionCountdağıtımın bir güç yasasına uygun olup olmadığını nasıl belirleyebilirim ? PoweRlaw paketini buldum …

13 r hypothesis-testing goodness-of-fit power-law

1

Lojistik regresyon modelinin değerlendirilmesi

Lojistik bir model üzerinde çalışıyorum ve sonuçları değerlendirmede bazı zorluklar yaşıyorum. Modelim bir binom logit. Açıklayıcı değişkenlerim: 15 seviyeli kategorik bir değişken, iki değişkenli ve 2 sürekli değişken. N harfim büyük> 8000. Firmaların yatırım yapma kararlarını modellemeye çalışıyorum. Bağımlı değişken yatırımdır (evet / hayır), 15 seviye değişkenleri yöneticiler tarafından bildirilen …

13 r logistic goodness-of-fit roc

2

Bir veri örneğinin Gamma dağılımı ailesine uyup uymadığını nasıl test edebilirim?

Sürekli rasgele bir değişken X'ten üretilen bir veri örneğim var. Ve R kullanarak çizilen histogramdan, X'in dağılımının belirli bir Gamma dağılımına uyduğunu tahmin ediyorum. Ama bu Gamma dağılımının kesin parametrelerini bilmiyorum. Sorum X'in dağılımının bir Gamma dağılımı ailesine ait olup olmadığını nasıl test edeceğim? Kolmogorov-Smirnov testi, Anderson-Darling testi ve benzeri …

13 distributions hypothesis-testing goodness-of-fit gamma-distribution

2

Lojistik regresyon modellerinin değerlendirilmesi

Bu soru, bir lojistik modelin yeterince iyi olup olmadığına nasıl karar verileceğime dair gerçek karışıklığımdan kaynaklanıyor. Bağımlı bir değişken olarak oluşturulduktan iki yıl sonra bireysel projenin durumunu kullanan modellerim var. Sonuç başarılı (1) ya da değil (0). Çiftlerin oluşumu sırasında ölçülen bağımsız değişkenlerim var. Amacım, varsaydığım bir değişkenin çiftlerin başarısını …

13 r logistic goodness-of-fit residuals

5

Elo derecelendirmesinin veya Sayfa sıralamasının kümem için bir anlamı olduğunu nasıl kanıtlayabilirim?

Bir takım oyuncularım var. Birbirlerine karşı oynarlar (çift olarak). Çift oyuncular rastgele seçilir. Herhangi bir oyunda, bir oyuncu kazanır ve diğeri kaybeder. Oyuncular birbirleriyle sınırlı sayıda oyun oynarlar (bazı oyuncular daha fazla oyun, bazıları daha az oyun oynar). Yani verilerim var (kim kime ve kaç kez kazanır). Şimdi her oyuncunun …

13 goodness-of-fit ranking rating

1

Kement için LARS ve koordinat inişi

L1 düzenli lineer regresyonu takmak için koordinat inişine karşı LARS [1] kullanmanın avantajları ve dezavantajları nelerdir? Ben esas olarak performans yönleriyle ilgileniyorum (sorunlarım Nyüzbinlerce ve p<20'de olma eğilimindedir ). Ancak, diğer görüşler de takdir edilecektir. edit: Soruyu gönderdiğimden beri, chl, Friedman ve arkadaşları tarafından koordinat inişinin diğer yöntemlerden önemli ölçüde …

13 regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

1

R'nin nls'larına uyumun iyiliği nasıl okunur?

Ben nls () çıktısını yorumlamaya çalışıyorum. Bunu okudum yazıyı ama hala en uygun seçim nasıl anlamıyorum. Benim uyar iki çıktı var: > summary(m) Formula: y ~ I(a * x^b) Parameters: Estimate Std. Error t value Pr(>|t|) a 479.92903 62.96371 7.622 0.000618 *** b 0.27553 0.04534 6.077 0.001744 ** --- Signif. …

12 r least-squares nonlinear-regression goodness-of-fit

1

Beklenen değeri

R 2 a d j u s t e d düzenlemesiyle ilgili olarak bu metnin ilk sayfasının altında yapılan ifadeyi merak ediyorumR2adjustedRadjusted2R^2_\mathrm{adjusted} R2adjusted=1−(1−R2)(n−1n−m−1).Radjusted2=1−(1−R2)(n−1n−m−1).R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right). Metin şunu belirtmektedir: Ayarlamanın mantığı şöyledir: sıradan çoklu regresyonda, rastgele bir tahminci yanıtın varyasyonunun ortalama oranını açıklar , böylece rastgele tahmin ediciler birlikte ortalama olarak yanıtın …

12 regression expected-value goodness-of-fit r-squared

1

R'de regresyon spline'ları ile Lojistik Regresyon

İngiltere'de kafa travması veri tabanındaki retrospektif verilere dayanan bir lojistik regresyon modeli geliştiriyorum. Kilit sonuç 30 günlük mortalite ("Hayatta Kalma" ölçüsü olarak ifade edilir). Önceki çalışmalarda sonuç üzerinde önemli etkisi olduğuna dair kanıtları yayınlanmış diğer önlemler şunlardır: Year - Year of procedure = 1994-2013 Age - Age of patient = …

12 r logistic generalized-linear-model goodness-of-fit regression-strategies

4

Çok büyük numune boyutları için uygunluk

Her gün çok büyük kategorik veri örnekleri (> 1.000.000) topluyorum ve veri toplamadaki hataları tespit etmek için verilerin günler arasında "önemli ölçüde" farklı göründüğünü görmek istiyorum. Uygun bir test (özellikle bir G-testi) kullanmanın bunun için iyi bir seçim olacağını düşündüm. Beklenen dağılım, bir önceki günün dağılımı ile verilir. Ancak, örnek …

12 goodness-of-fit large-data

3

Benim modeli tanı metrik (dayalı herhangi iyi, var

Modelimi taktım ve bunun iyi olup olmadığını anlamaya çalışıyorum. Değerlendirmek için önerilen metrikleri hesapladım ( / AUC / doğruluk / tahmin hatası / vb) ancak bunları nasıl yorumlayacağımı bilmiyorum. Kısacası, modelimin metriğe göre iyi olup olmadığını nasıl anlarım? BirR2R2R^2R2R2R^2 yeterli (örneğin) 0,6 beni çıkarımlar veya baz bilimsel / iş kararları …

12 goodness-of-fit r-squared accuracy auc diagnostic

2

Kolmogorov – Smirnov testi: p-değeri ve ks-test istatistiği örneklem büyüklüğü arttıkça azalır

P-değerleri ve ks-test istatistikleri, artan örneklem büyüklüğü ile neden azalıyor? Bu Python kodunu örnek olarak alalım: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) Sonuçlar: Ks_2sampResult(statistic=0.30000000000000004, pvalue=0.67507815371659508) Ks_2sampResult(statistic=0.080000000000000071, …

12 python p-value goodness-of-fit intuition scipy

1

Sıfır şişirilmiş Poisson veya sıfır şişirilmiş negatif binom için “sapma” ölçüsü mü?

D = 2 * (doymuş modelin log-olasılığı eksi modelin log-olasılığı) olarak tanımlanan ölçek sapması genellikle GLM modellerinde uyum iyiliğinin bir ölçüsü olarak kullanılır. [D (null model) - D (takılı model)] / D (null model) olarak tanımlanan açıklanan yüzde sapma, bazen doğrusal regresyonun R-karesi için GLM analogu olarak da kullanılır. ZIP …

11 goodness-of-fit zero-inflation deviance

«goodness-of-fit» etiketlenmiş sorular