Kappa ( ) istatistiği, 1960 yılında, iki puanlayıcı arasındaki anlaşmayı ölçmek için Cohen [1] tarafından tanıtıldı. Bununla birlikte, varyansı bir süredir çelişkilerin kaynağı olmuştur.
Benim sorum büyük örneklemlerde kullanılacak en iyi varyans hesaplamasının hangisi olduğu hakkında. Fleiss [2] tarafından test edilen ve doğrulanan birinin doğru seçim olduğuna inanmaya meyilliyim, ancak bu doğru gibi görünen (ve oldukça yeni literatürde kullanılmış) tek yayınlanmış görünmüyor.
Şu anda asimptotik büyük örneklem varyansını hesaplamak için iki somut yolum var:
- Fleiss, Cohen ve Everitt [2] tarafından yayınlanan düzeltilmiş yöntem;
- Kitapta Colgaton tarafından bulunabilecek delta yöntemi, 2009 [4] (sayfa 106).
Bu karışıklığı açıklamak için, Fleiss, Cohen ve Everitt [2] tarafından yapılan bir alıntı, benimkine vurgu yapıyor:
Nihai başarıya ulaşılmadan önce birçok insan çabası tekrarlanan başarısızlıklarla lanetlendi. Everest Dağı'nın ölçeklendirilmesi buna bir örnektir. Kuzeybatı Geçidi'nin keşfi ikinci. Kappa için doğru bir standart hatanın türetilmesi üçte birdir .
Yani, burada olanların küçük bir özeti:
- 1960: Cohen gazetesini "Nominal ölçekler için anlaşmanın bir katsayısını" yayınlamaktadır [1] olarak adlandırılan iki raters arasındaki anlaşmanın onun şansı düzeltilmiş tedbirler getirmek . Bununla birlikte, varyans hesaplamaları için yanlış formüller yayınlamaktadır.
- 1968: Everitt onları düzeltmeye çalıştı, ancak formülleri de yanlıştı.
- 1969: Fleiss, Cohen ve Everitt "Kappa ve Ağırlıklı Kappa Büyük Örnek Standart Hataları" adlı makalesinde doğru formülleri yayınladı [2].
- 1971: Fleiss , aynı ad altında, farklılıklar için yanlış formüllerle başka bir istatistiği yayınladı (ancak farklı bir tane).
- 1979: Fleiss Nee ve Landis, Fleiss'in için düzeltilmiş formüllerini yayınladı .
İlk başta, aşağıdaki gösterimi dikkate alın. Bu gösterim, toplama işlecinin noktanın yerleştirildiği boyuttaki tüm öğelere uygulanması gerektiğini belirtir:
p . j = k ∑ i = 1 p i j
Şimdi, biri Kappa'yı şu şekilde hesaplayabilir:
Hangi içinde
gözlenen anlaşma ve
şans anlaşmasıyım.
Şimdiye kadar, Cohen'in için doğru varyans hesaplaması şöyle yapılır:
ve sıfır hipotezi altında şöyle verilir:
Congalton'un metodu varyans elde etmek için delta metoduna dayanıyor gibi görünmektedir (Agresti, 1990; Agresti, 2002); ancak delta yönteminin ne olduğundan veya neden kullanılması gerektiğinden emin değilim. varyans, bu yöntem kapsamında, aşağıdaki eşitlikle verilir:
içinde
(Congalton bir kullanan daha çok simge , Ancak aynı şey anlamına görünmektedir. Buna ek olarak, varsayarak am bir sayma matris olmalıdır, yani numune sayısı bölü önce karışıklık matrisi formülüyle ilgili )
Diğer bir tuhaf bölüm, Colgaton'un kitabının orijinal makaleyi Cohen'e gönderme gibi görünmesidir, ancak Fleiss ve arkadaşlarının yayınlanan Kappa varyansındaki düzeltmeleri, Kappa hakkında tartışmaya devam edene kadar göstermediği görülmektedir. Belki de ilk yayını kappa'nın gerçek formülü hala kargaşada kaybolurken yazılmıştı?
Birisi bu farklılıkların nedenini açıklayabilir mi? Veya neden biri Fleiss tarafından düzeltilmiş versiyonu yerine delta metodu varyansını kullanıyor?
[1]: Fleiss, Joseph L .; Cohen, Jacob; Everitt, BS; Kappa ve ağırlıklı kappa büyük örnek standart hataları. Psikolojik Bülten, Cilt 72 (5), Kasım 1969, 323-327. doi: 10.1037 / h0028106
[2]: Cohen, Jacob (1960). Nominal ölçekler için anlaşma katsayısı. Eğitim ve Psikolojik Ölçüm 20 (1): 37–46. DOI: 10,1177 / 001316446002000104.
[3]: Alan Agresti, Kategorik Veri Analizi, 2. baskı. John Wiley ve Oğulları, 2002.
[4]: Russell G. Congalton ve Green, K .; Uzaktan Algılanan Verilerin Doğruluğunu Değerlendirme: İlkeler ve Uygulamalar, 2. baskı. 2009.