«reliability» etiketlenmiş sorular

Bir tedbirin, tutarlı koşullar altında benzer sonuçlar üretmesi durumunda yüksek bir güvenilirliğe sahip olduğu söylenir. Güvenilirliği geçerlilikle karıştırmayın (bkz. Wiki etiketi). Kendi etiket derecelendiricileri olan değerlendiriciler arası güvenilirlik için KULLANMAYIN

1
Hesaplama Cohen'in Kappa varyansı (ve standart hatalar)
Kappa ( κκ\kappa ) istatistiği, 1960 yılında, iki puanlayıcı arasındaki anlaşmayı ölçmek için Cohen [1] tarafından tanıtıldı. Bununla birlikte, varyansı bir süredir çelişkilerin kaynağı olmuştur. Benim sorum büyük örneklemlerde kullanılacak en iyi varyans hesaplamasının hangisi olduğu hakkında. Fleiss [2] tarafından test edilen ve doğrulanan birinin doğru seçim olduğuna inanmaya meyilliyim, …

3
Verilerim hangi dağıtımı takip ediyor?
Diyelim ki 1000 bileşenim olduğunu ve bu girişlerin kaç kez başarısız olduğunu ve her girişimde hata verdiğine dair veri topladığımı varsayalım, ayrıca ekibimin sorunu çözmesinin ne kadar sürdüğünü de izliyorum. Kısacası, bu 1000 bileşenin her biri için onarım süresini (saniye olarak) kaydediyorum. Veriler bu sorunun sonunda verilmiştir. Tüm bu değerleri …

1
Bir lmer modelden etkilerin tekrarlanabilirliğinin hesaplanması
Bu yazıda , karışık etki modellemesi ile bir ölçümün tekrarlanabilirliğini (diğer bir deyişle güvenilirlik, sınıf içi korelasyon) nasıl hesaplayacağımı anladım . R kodu şöyle olurdu: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

2
Joel Spolsky'nin “Snark Avcılığı” geçerli bir istatistiksel içerik analizi midir?
Son zamanlarda topluluk bültenlerini okuyorsanız , StackExchange ağının CEO'su Joel Spolsky'nin resmi StackExchange blogunda yayınlanan bir yazı olan The Snark The Hunting'u gördünüz . Dış kaynaklı bir bakış açısıyla "dostluğunu" değerlendirmek için bir SE yorumu örneği üzerinde yapılan istatistiksel bir analizden bahseder. Yorumlar StackOverflow'tan rastgele örneklendi ve içerik analistleri, şirketleri …

2
Sıra veya aralık verileri için puanlayıcılar arası güvenilirlik
Sıralı veya aralıklı veriler için en çok puanlayıcılar arası güvenilirlik yöntemleri hangileridir? "Ortak anlaşma olasılığı" veya "Kappa" nın nominal veriler için tasarlandığını düşünüyorum. "Pearson" ve "Spearman" kullanılabilse de, esas olarak iki puanlayıcı için kullanılırlar (ikiden fazla puanlayıcı için kullanılsalar da). Sıralı veya aralıklı veriler için, yani ikiden fazla puanlayıcı için …

2
Bir anketin güvenilirliğini değerlendirme: boyutsallık, sorunlu öğeler ve alfa, lambda6 veya başka bir indeks kullanıp kullanmayacağınız?
Bir deneye katılan katılımcılar tarafından verilen puanları analiz ediyorum. Katılımcıların bir ürüne karşı tutumunu tahmin etmeyi amaçlayan 6 maddeden oluşan anketimin güvenilirliğini tahmin etmek istiyorum. Tüm maddelere tek bir ölçek gibi davranarak (alfa yaklaşık 0.6 idi) ve her seferinde bir öğeyi sildiğimde (maks alfa yaklaşık 0.72 idi) Cronbach alfa hesapladım. …

2
ROC eğrisinin altındaki alana karşı doğruluk
Bir teşhis sistemi için bir ROC eğrisi oluşturdum. Daha sonra eğrinin altındaki alanın parametrik olmayan bir şekilde AUC = 0.89 olduğu tahmin edildi. En uygun eşik ayarında doğruluğu hesaplamaya çalıştığımda (noktaya en yakın nokta (0, 1)), teşhis sisteminin doğruluğunu 0.8 olarak aldım, bu da AUC'den daha az! Hassasiyeti optimum eşikten …

3
Cronbach alfa değerleri için tanımlayıcılar nereden geliyor (örn. Zayıf, mükemmel)?
Cronbach'ın alfa değerlerini şu şekilde tanımlamak oldukça yaygın görünmektedir: α ≥ 0.9 Mükemmel 0.7 ≤ α <0.9 İyi 0,6 ≤ α <0,7 Kabul edilebilir 0.5 ≤ α <0.6 Kötü α <0.5 Kabul edilemez Bu değerler nereden geliyor? Bunları açıklayan özgün bir araştırma makalesi bulamıyorum. Düzenleme: Ben sadece kongre dayalı% 90 …

4
Güvenilmez / karışık / geçersiz çalışmaların veya modellerin kötüye kullanıldığı halk sağlığı politikası araştırmalarında vaka çalışmaları nelerdir?
Verilerin karıştırıldığı mevcut bir halk sağlığı sorunu üzerine bir literatür taraması hazırlıyorum: Halk sağlığı / epidemiyoloji eğitiminde, geçersiz veya birbirine bağlı ilişkilerin veya çıkarımların kasıtlı veya hatalı olarak halk sağlığı politikası ve mevzuatında kullanıldığı yaygın tarihsel vaka çalışmaları nelerdir? Yasa gereği yapılmalıdır hava yastıkları sonunda emniyet kemerleri belirlenir ve 1960 …

1
Caret glmnet vs cv.glmnet
Optimal bir lambda aramak için glmnetiçeride caretkullanma cv.glmnetve aynı görevi yapmak için kullanma karşılaştırmasında çok fazla karışıklık var gibi görünüyor . Birçok soru yöneltildi, örneğin: Sınıflandırma modeli train.glmnet mi cv.glmnet mi? Glmnet'i caret ile kullanmanın doğru yolu nedir? "Caret" kullanarak çapraz onaylama "glmnet" ancak sorunun tekrarlanabilirliğinden kaynaklanabilecek hiçbir cevap verilmemiştir. …

2
Etkinlik zamanı hakkında belirsizliği olan bir zaman serisindeki olaylar için ara güvenilirliği
Bir zaman serisindeki olayları tanımlamaya çalışan birden fazla bağımsız kodlayıcım var - bu durumda, yüz yüze sohbetin videosunu izlemek ve belirli sözsüz davranışlar (örneğin kafa başlıkları) aramak ve her birinin zamanını ve kategorisini kodlamak Etkinlik. Bu veriler, hangisi ile çalışmak daha kolay olursa, yüksek örnekleme hızına (30 kare / saniye) …

2
Anketten yararsız soruların belirlenmesi
Bir anket geliştiriyorum. Güvenilirliğini ve geçerliliğini artırmak için istatistiksel yöntemler kullanmak istiyorum. Cevapları hep aynı olan soruları ortadan kaldırmak istiyorum. Bu, neredeyse tüm katılımcıların bu sorulara aynı cevapları verdiği anlamına gelir. Şimdi sorularım: Kullanım bağlamından bağımsız olarak cevapları her zaman aynı olan bu işe yaramaz soruların teknik terimi nedir? Bu …

2
Faktör analizi, iç tutarlılık ve madde yanıt teorisi ile birlikte madde sayısı nasıl azaltılır?
Ampirik olarak bir anket geliştirme sürecindeyim ve bu örnekte rasgele sayılar kullanacağım. Bağlam için, anksiyete bozuklukları olan bireylerde sıkça tanımlanan düşünce kalıplarını değerlendirmeye yönelik psikolojik bir anket geliştiriyorum. Bir öğe, " Kapalı olduğundan emin olamadığım için fırını tekrar tekrar kontrol etmem gerekiyor " gibi görünebilir . Bir ya da iki …

3
Uygun bir eğrinin güvenilirliği?
Uygun bir eğrinin belirsizliğini veya güvenilirliğini tahmin etmek istiyorum. Ne olduğunu bilmediğim için kasıtlı olarak aradığım kesin bir matematik miktarını adlandırmıyorum. Burada (enerji) bağımlı değişkendir (yanıt) ve V (hacim) bağımsız değişkendir. Enerji-Hacim eğrisini bulmak istiyorum, E ( V )EEEVVVE( V)E(V)E(V)Bazı malzemelerin . Bu yüzden bazı numune hacimleri için enerji elde …

2
Aykırı değerleri tespit etmek için IQR ne kadar doğrudur
İşlemlerin çalışma sürelerini analiz eden bir komut dosyası yazıyorum. Onların dağıtım emin değilim ama bir sürecin "çok uzun" çalışır olmadığını bilmek istiyorum. Şimdiye kadar son çalışma sürelerinin 3 standart sapmasını kullanıyorum (n> 30), ancak veriler normal değilse (ki bu görünmüyorsa) bunun yararlı bir şey sağlamadığı söylendi. Belirten başka bir aykırı …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.