İstatistikler ve Büyük Veri reliability

1

Hesaplama Cohen'in Kappa varyansı (ve standart hatalar)

Kappa ( κκ\kappa ) istatistiği, 1960 yılında, iki puanlayıcı arasındaki anlaşmayı ölçmek için Cohen [1] tarafından tanıtıldı. Bununla birlikte, varyansı bir süredir çelişkilerin kaynağı olmuştur. Benim sorum büyük örneklemlerde kullanılacak en iyi varyans hesaplamasının hangisi olduğu hakkında. Fleiss [2] tarafından test edilen ve doğrulanan birinin doğru seçim olduğuna inanmaya meyilliyim, …

44 estimation variance reliability cohens-kappa

3

Verilerim hangi dağıtımı takip ediyor?

Diyelim ki 1000 bileşenim olduğunu ve bu girişlerin kaç kez başarısız olduğunu ve her girişimde hata verdiğine dair veri topladığımı varsayalım, ayrıca ekibimin sorunu çözmesinin ne kadar sürdüğünü de izliyorum. Kısacası, bu 1000 bileşenin her biri için onarım süresini (saniye olarak) kaydediyorum. Veriler bu sorunun sonunda verilmiştir. Tüm bu değerleri …

31 distributions data-visualization survival reliability distribution-identification

1

Bir lmer modelden etkilerin tekrarlanabilirliğinin hesaplanması

Bu yazıda , karışık etki modellemesi ile bir ölçümün tekrarlanabilirliğini (diğer bir deyişle güvenilirlik, sınıf içi korelasyon) nasıl hesaplayacağımı anladım . R kodu şöyle olurdu: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = …

28 mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

2

Joel Spolsky'nin “Snark Avcılığı” geçerli bir istatistiksel içerik analizi midir?

Son zamanlarda topluluk bültenlerini okuyorsanız , StackExchange ağının CEO'su Joel Spolsky'nin resmi StackExchange blogunda yayınlanan bir yazı olan The Snark The Hunting'u gördünüz . Dış kaynaklı bir bakış açısıyla "dostluğunu" değerlendirmek için bir SE yorumu örneği üzerinde yapılan istatistiksel bir analizden bahseder. Yorumlar StackOverflow'tan rastgele örneklendi ve içerik analistleri, şirketleri …

25 reliability agreement-statistics methodology

2

Sıra veya aralık verileri için puanlayıcılar arası güvenilirlik

Sıralı veya aralıklı veriler için en çok puanlayıcılar arası güvenilirlik yöntemleri hangileridir? "Ortak anlaşma olasılığı" veya "Kappa" nın nominal veriler için tasarlandığını düşünüyorum. "Pearson" ve "Spearman" kullanılabilse de, esas olarak iki puanlayıcı için kullanılırlar (ikiden fazla puanlayıcı için kullanılsalar da). Sıralı veya aralıklı veriler için, yani ikiden fazla puanlayıcı için …

25 reliability psychometrics agreement-statistics cohens-kappa

2

Bir anketin güvenilirliğini değerlendirme: boyutsallık, sorunlu öğeler ve alfa, lambda6 veya başka bir indeks kullanıp kullanmayacağınız?

Bir deneye katılan katılımcılar tarafından verilen puanları analiz ediyorum. Katılımcıların bir ürüne karşı tutumunu tahmin etmeyi amaçlayan 6 maddeden oluşan anketimin güvenilirliğini tahmin etmek istiyorum. Tüm maddelere tek bir ölçek gibi davranarak (alfa yaklaşık 0.6 idi) ve her seferinde bir öğeyi sildiğimde (maks alfa yaklaşık 0.72 idi) Cronbach alfa hesapladım. …

16 pca reliability scales psychometrics cronbachs-alpha

2

ROC eğrisinin altındaki alana karşı doğruluk

Bir teşhis sistemi için bir ROC eğrisi oluşturdum. Daha sonra eğrinin altındaki alanın parametrik olmayan bir şekilde AUC = 0.89 olduğu tahmin edildi. En uygun eşik ayarında doğruluğu hesaplamaya çalıştığımda (noktaya en yakın nokta (0, 1)), teşhis sisteminin doğruluğunu 0.8 olarak aldım, bu da AUC'den daha az! Hassasiyeti optimum eşikten …

16 roc reliability accuracy auc

3

Cronbach alfa değerleri için tanımlayıcılar nereden geliyor (örn. Zayıf, mükemmel)?

Cronbach'ın alfa değerlerini şu şekilde tanımlamak oldukça yaygın görünmektedir: α ≥ 0.9 Mükemmel 0.7 ≤ α <0.9 İyi 0,6 ≤ α <0,7 Kabul edilebilir 0.5 ≤ α <0.6 Kötü α <0.5 Kabul edilemez Bu değerler nereden geliyor? Bunları açıklayan özgün bir araştırma makalesi bulamıyorum. Düzenleme: Ben sadece kongre dayalı% 90 …

14 reliability psychometrics cronbachs-alpha

4

Güvenilmez / karışık / geçersiz çalışmaların veya modellerin kötüye kullanıldığı halk sağlığı politikası araştırmalarında vaka çalışmaları nelerdir?

Verilerin karıştırıldığı mevcut bir halk sağlığı sorunu üzerine bir literatür taraması hazırlıyorum: Halk sağlığı / epidemiyoloji eğitiminde, geçersiz veya birbirine bağlı ilişkilerin veya çıkarımların kasıtlı veya hatalı olarak halk sağlığı politikası ve mevzuatında kullanıldığı yaygın tarihsel vaka çalışmaları nelerdir? Yasa gereği yapılmalıdır hava yastıkları sonunda emniyet kemerleri belirlenir ve 1960 …

14 cross-validation reliability epidemiology biostatistics

1

Caret glmnet vs cv.glmnet

Optimal bir lambda aramak için glmnetiçeride caretkullanma cv.glmnetve aynı görevi yapmak için kullanma karşılaştırmasında çok fazla karışıklık var gibi görünüyor . Birçok soru yöneltildi, örneğin: Sınıflandırma modeli train.glmnet mi cv.glmnet mi? Glmnet'i caret ile kullanmanın doğru yolu nedir? "Caret" kullanarak çapraz onaylama "glmnet" ancak sorunun tekrarlanabilirliğinden kaynaklanabilecek hiçbir cevap verilmemiştir. …

14 r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

2

Etkinlik zamanı hakkında belirsizliği olan bir zaman serisindeki olaylar için ara güvenilirliği

Bir zaman serisindeki olayları tanımlamaya çalışan birden fazla bağımsız kodlayıcım var - bu durumda, yüz yüze sohbetin videosunu izlemek ve belirli sözsüz davranışlar (örneğin kafa başlıkları) aramak ve her birinin zamanını ve kategorisini kodlamak Etkinlik. Bu veriler, hangisi ile çalışmak daha kolay olursa, yüksek örnekleme hızına (30 kare / saniye) …

13 time-series reliability agreement-statistics

2

Anketten yararsız soruların belirlenmesi

Bir anket geliştiriyorum. Güvenilirliğini ve geçerliliğini artırmak için istatistiksel yöntemler kullanmak istiyorum. Cevapları hep aynı olan soruları ortadan kaldırmak istiyorum. Bu, neredeyse tüm katılımcıların bu sorulara aynı cevapları verdiği anlamına gelir. Şimdi sorularım: Kullanım bağlamından bağımsız olarak cevapları her zaman aynı olan bu işe yaramaz soruların teknik terimi nedir? Bu …

12 survey reliability psychometrics validity

2

Faktör analizi, iç tutarlılık ve madde yanıt teorisi ile birlikte madde sayısı nasıl azaltılır?

Ampirik olarak bir anket geliştirme sürecindeyim ve bu örnekte rasgele sayılar kullanacağım. Bağlam için, anksiyete bozuklukları olan bireylerde sıkça tanımlanan düşünce kalıplarını değerlendirmeye yönelik psikolojik bir anket geliştiriyorum. Bir öğe, " Kapalı olduğundan emin olamadığım için fırını tekrar tekrar kontrol etmem gerekiyor " gibi görünebilir . Bir ya da iki …

12 factor-analysis reliability psychometrics latent-variable validity

3

Uygun bir eğrinin güvenilirliği?

Uygun bir eğrinin belirsizliğini veya güvenilirliğini tahmin etmek istiyorum. Ne olduğunu bilmediğim için kasıtlı olarak aradığım kesin bir matematik miktarını adlandırmıyorum. Burada (enerji) bağımlı değişkendir (yanıt) ve V (hacim) bağımsız değişkendir. Enerji-Hacim eğrisini bulmak istiyorum, E ( V )EEEVVVE( V)E(V)E(V)Bazı malzemelerin . Bu yüzden bazı numune hacimleri için enerji elde …

11 error fitting reliability uncertainty

2

Aykırı değerleri tespit etmek için IQR ne kadar doğrudur

İşlemlerin çalışma sürelerini analiz eden bir komut dosyası yazıyorum. Onların dağıtım emin değilim ama bir sürecin "çok uzun" çalışır olmadığını bilmek istiyorum. Şimdiye kadar son çalışma sürelerinin 3 standart sapmasını kullanıyorum (n> 30), ancak veriler normal değilse (ki bu görünmüyorsa) bunun yararlı bir şey sağlamadığı söylendi. Belirten başka bir aykırı …

11 outliers reliability average

«reliability» etiketlenmiş sorular