Hesaplama Cohen'in Kappa varyansı (ve standart hatalar)


44

Kappa ( κ ) istatistiği, 1960 yılında, iki puanlayıcı arasındaki anlaşmayı ölçmek için Cohen [1] tarafından tanıtıldı. Bununla birlikte, varyansı bir süredir çelişkilerin kaynağı olmuştur.

Benim sorum büyük örneklemlerde kullanılacak en iyi varyans hesaplamasının hangisi olduğu hakkında. Fleiss [2] tarafından test edilen ve doğrulanan birinin doğru seçim olduğuna inanmaya meyilliyim, ancak bu doğru gibi görünen (ve oldukça yeni literatürde kullanılmış) tek yayınlanmış görünmüyor.

Şu anda asimptotik büyük örneklem varyansını hesaplamak için iki somut yolum var:

  • Fleiss, Cohen ve Everitt [2] tarafından yayınlanan düzeltilmiş yöntem;
  • Kitapta Colgaton tarafından bulunabilecek delta yöntemi, 2009 [4] (sayfa 106).

Bu karışıklığı açıklamak için, Fleiss, Cohen ve Everitt [2] tarafından yapılan bir alıntı, benimkine vurgu yapıyor:

Nihai başarıya ulaşılmadan önce birçok insan çabası tekrarlanan başarısızlıklarla lanetlendi. Everest Dağı'nın ölçeklendirilmesi buna bir örnektir. Kuzeybatı Geçidi'nin keşfi ikinci. Kappa için doğru bir standart hatanın türetilmesi üçte birdir .

Yani, burada olanların küçük bir özeti:

  • 1960: Cohen gazetesini "Nominal ölçekler için anlaşmanın bir katsayısını" yayınlamaktadır [1] olarak adlandırılan iki raters arasındaki anlaşmanın onun şansı düzeltilmiş tedbirler getirmek . Bununla birlikte, varyans hesaplamaları için yanlış formüller yayınlamaktadır.κ
  • 1968: Everitt onları düzeltmeye çalıştı, ancak formülleri de yanlıştı.
  • 1969: Fleiss, Cohen ve Everitt "Kappa ve Ağırlıklı Kappa Büyük Örnek Standart Hataları" adlı makalesinde doğru formülleri yayınladı [2].
  • 1971: Fleiss , aynı ad altında, farklılıklar için yanlış formüllerle başka bir istatistiği yayınladı (ancak farklı bir tane).κ
  • 1979: Fleiss Nee ve Landis, Fleiss'in için düzeltilmiş formüllerini yayınladı .κ

İlk başta, aşağıdaki gösterimi dikkate alın. Bu gösterim, toplama işlecinin noktanın yerleştirildiği boyuttaki tüm öğelere uygulanması gerektiğini belirtir:

   pben.=Σj=1kpbenj p . j = k i = 1 p i j   p.j=Σben=1kpbenj

Şimdi, biri Kappa'yı şu şekilde hesaplayabilir:

   κ^=pÖ-pc1-pe

Hangi içinde

   pÖ=Σben=1kpbenben gözlenen anlaşma ve

   pc=Σben=1kpben.p.ben şans anlaşmasıyım.

Şimdiye kadar, Cohen'in κ için doğru varyans hesaplaması şöyle yapılır:

   vbirr^(κ^)=1N-(1-pc)4{Σben=1kpbenben[(1-pÖ)-(p.ben+pben.)(1-pÖ)]2   +(1-pÖ)2Σben=1kΣj=1benjkpbenj(p.ben+pj.)2-(pÖpc-2pc+pÖ)2}

ve sıfır hipotezi altında şöyle verilir:

   vbirr^(κ^)=1N-(1-pc)2{Σben=1kp.benpben.[1-(p.ben+pben.)2]+Σben=1kΣj=1,benjkp.benpj.(p.ben+pj.)2-pc2}

Congalton'un metodu varyans elde etmek için delta metoduna dayanıyor gibi görünmektedir (Agresti, 1990; Agresti, 2002); ancak delta yönteminin ne olduğundan veya neden kullanılması gerektiğinden emin değilim. varyans, bu yöntem kapsamında, aşağıdaki eşitlikle verilir:κ

   vbirr^(κ^)=1n{θ1(1-θ1)(1-θ2)2+2(1-θ1)(2θ1θ2-θ3)(1-θ2)3+(1-θ1)2(θ4-4θ22)(1-θ2)4}

içinde

   θ1=1nΣben=1knbenben

   θ2=1n2Σben=1knben+n+ben

   θ3=1n2Σben=1knbenben(nben++n+ben)

   θ4=1n3Σben=1kΣj=1knbenj(nj++n+ben)2

(Congalton bir kullanan daha çok simge , Ancak aynı şey anlamına görünmektedir. Buna ek olarak, varsayarak am bir sayma matris olmalıdır, yani numune sayısı bölü önce karışıklık matrisi formülüyle ilgili )+.nbenjpbenj=nbenjsbirmples

Diğer bir tuhaf bölüm, Colgaton'un kitabının orijinal makaleyi Cohen'e gönderme gibi görünmesidir, ancak Fleiss ve arkadaşlarının yayınlanan Kappa varyansındaki düzeltmeleri, Kappa hakkında tartışmaya devam edene kadar göstermediği görülmektedir. Belki de ilk yayını kappa'nın gerçek formülü hala kargaşada kaybolurken yazılmıştı?

Birisi bu farklılıkların nedenini açıklayabilir mi? Veya neden biri Fleiss tarafından düzeltilmiş versiyonu yerine delta metodu varyansını kullanıyor?

[1]: Fleiss, Joseph L .; Cohen, Jacob; Everitt, BS; Kappa ve ağırlıklı kappa büyük örnek standart hataları. Psikolojik Bülten, Cilt 72 (5), Kasım 1969, 323-327. doi: 10.1037 / h0028106

[2]: Cohen, Jacob (1960). Nominal ölçekler için anlaşma katsayısı. Eğitim ve Psikolojik Ölçüm 20 (1): 37–46. DOI: 10,1177 / 001316446002000104.

[3]: Alan Agresti, Kategorik Veri Analizi, 2. baskı. John Wiley ve Oğulları, 2002.

[4]: Russell G. Congalton ve Green, K .; Uzaktan Algılanan Verilerin Doğruluğunu Değerlendirme: İlkeler ve Uygulamalar, 2. baskı. 2009.


parantezlerin bazıları kapalı, lütfen düzeltebilir misin? Ayrıca, yuvalanmış parantezleri daha okunaklı hale getirmek için {[(x + y) ^ z + a] ^ b - c} şeklinde biçimlendirmek isteyebilirsiniz.
StasK

Ayrıca, lütfen kendilerine ve alternatif eşdeğer formülasyonları verin. Özel alternatif formülasyonlara bağlı olarak, varyans ifadelerinin elde edilmesi daha kolay olabilir. (Gini endeksini düşünüyorum; bunun için, karmaşık anket verileri için tamamen farklı varyans tahmin edicileri ima eden, iid verisi için beş ya da daha fazla formülasyon var.)κ
StasK

Geri dönüşünüz için teşekkür ederiz. Formülleri düzelttim ve Kappa'nın nasıl hesaplandığını ekledim. Kappa formülasyonu literatürde tutarlı görünüyor, sadece varyansı yok.
Cesar

1
Bu arada, Colgaton'un kitabında ne gibi bir baskı hatası olduğunu fark ettim: tanımlar , ancak bu hiçbir yerden geliyor. Sanırım , aksi halde çok mantıklı olduğundan emin değilim. pc=Σben=1kpben+p+jjpc=Σben=1kpben+p+ben
Cesar

2
En azından bu kısmı ile bir el verebilir: "Emin delta yöntemidir ne değilim" - en.wikipedia.org/wiki/Delta_method ve varyans gelen gelir ki burada
Glen_b

Yanıtlar:


7

Varyansı hesaplamanın iki yolundan hangisini tercih edeceğimi bilmiyorum ama Cohen's Kappa'nın Bayesian tahminini kullanarak güven / güvenilir aralıkları hesaplamanız için size üçüncü, pratik ve kullanışlı bir yol verebilirim.

Aşağıdaki R ve JAGS kodu, veriler verilen Kappa'nın güvenilir değerlerinin posterior dağılımından MCMC numuneleri oluşturur.

library(rjags)
library(coda)
library(psych)

# Creating some mock data
rater1 <- c(1, 2, 3, 1, 1, 2, 1, 1, 3, 1, 2, 3, 3, 2, 3) 
rater2 <- c(1, 2, 2, 1, 2, 2, 3, 1, 3, 1, 2, 3, 2, 1, 1) 
agreement <- rater1 == rater2
n_categories <- 3
n_ratings <- 15

# The JAGS model definition, should work in WinBugs with minimal modification
kohen_model_string <- "model {
  kappa <- (p_agreement - chance_agreement) / (1 - chance_agreement)
  chance_agreement <- sum(p1 * p2)

  for(i in 1:n_ratings) {
    rater1[i] ~ dcat(p1)
    rater2[i] ~ dcat(p2)
    agreement[i] ~ dbern(p_agreement)
  }

  # Uniform priors on all parameters
  p1 ~ ddirch(alpha)
  p2 ~ ddirch(alpha)
  p_agreement ~ dbeta(1, 1)
  for(cat_i in 1:n_categories) {
    alpha[cat_i] <- 1
  }
}"

# Running the model
kohen_model <- jags.model(file = textConnection(kohen_model_string),
                 data = list(rater1 = rater1, rater2 = rater2,
                   agreement = agreement, n_categories = n_categories,
                   n_ratings = n_ratings),
                 n.chains= 1, n.adapt= 1000)

update(kohen_model, 10000)
mcmc_samples <- coda.samples(kohen_model, variable.names="kappa", n.iter=20000)

Aşağıdaki grafik, Kappa'nın posterior dağılımından gelen MCMC numunelerinin bir yoğunluk grafiğini göstermektedir.

Posterior Kappa yoğunluğu

MCMC örneklerini kullanarak artık Medyan değerini Kappa'nın bir tahmini olarak kullanabiliriz ve% 2,5 ve% 97,5'lik nicelikleri% 95 güven / güvenilir aralık olarak kullanabiliriz.

summary(mcmc_samples)$quantiles
##      2.5%        25%        50%        75%      97.5% 
## 0.01688361 0.26103573 0.38753814 0.50757431 0.70288890 

Bunu Fleiss, Cohen ve Everitt'e göre hesaplanan "klasik" tahminlerle karşılaştırın:

cohen.kappa(cbind(rater1, rater2), alpha=0.05)
##                  lower estimate upper
## unweighted kappa  0.041     0.40  0.76

Şahsen, özellikle de Bayesian güven aralığının daha küçük örnekleme özelliklerine sahip olduğuna inandığım için klasik güven aralığı boyunca Bayesian güven aralığını tercih ederdim. İnsanların Bayesan analizlerinde sahip olma eğiliminde olan ortak bir endişe, parametrelerin dağılımına ilişkin önceki inançları belirtmeniz gerektiğidir. Neyse ki, bu durumda, tüm parametreler üzerinde tekdüze dağılımlar koyarak, "amaç" önceliklerini oluşturmak kolaydır. Bu, Bayesian modelin sonucunu Kappa katsayısının "klasik" bir hesaplamasına çok benzer kılmalıdır.

Referanslar

Sanjib Basu, Mousumi Banerjee ve Ananda Sen (2000). Tek ve Çoklu Çalışmalardan Kappa İçin Bayesci Çıkarım. Biometrics , Vol. 56, No. 2 (Jun, 2000), sayfa 577-582


Bunun ikiden fazla puanlayıcı için bir uzantısı olup olmadığını biliyor musunuz?
Fomite
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.