Aşağıdaki biçime sahip bir veri kümem var.
İkili sonuç kanseri var / kanser yok. Veri setindeki her doktor her hastayı gördü ve hastanın kanser olup olmadığı konusunda bağımsız bir karar verdi. Doktorlar daha sonra teşhislerinin doğru olduğuna dair güven seviyelerini 5 üzerinden verir ve güven seviyesi parantez içinde gösterilir.
Bu veri kümesinden iyi tahminler almanın çeşitli yollarını denedim.
Güven düzeylerini görmezden gelerek doktorlar arasında ortalama bir değer elde etmek benim için gayet iyi çalışıyor. Yukarıdaki tabloda, Hasta 1 ve Hasta 2 için doğru tanıları üretecekti, ancak yanlış bir şekilde Hasta 3'ün kanser olduğunu söylemiş olurdu, çünkü 2-1 çoğunlukta doktorlar Hasta 3'ün kanser olduğunu düşünüyorlar.
Ayrıca iki doktoru rastgele örneklediğimiz bir yöntem denedim ve eğer birbirleriyle aynı fikirde değillerse, karar oyu hangi doktordan daha emin olursa olsun. Bu yöntem, çok fazla doktora danışmamız gerekmediği için ekonomiktir, ancak hata oranını biraz arttırır.
İki doktoru rastgele seçtiğimiz ilgili bir yöntemi denedim ve eğer birbirleriyle aynı fikirde değillerse rastgele iki tane daha seçiyoruz. Bir tanı en az iki 'oy' ile devam ederse, o tanı lehine olan şeyleri çözeriz. Değilse, daha fazla doktor örnek alıyoruz. Bu yöntem oldukça ekonomiktir ve çok fazla hata yapmaz.
Bir şeyler yapmanın daha karmaşık bir yolunu kaçırdığımı hissetmeye yardım edemem. Örneğin, veri kümesini eğitim ve test setlerine ayırabileceğim bir yol olup olmadığını merak ediyorum ve tanıları birleştirmek için en uygun yolu çalıştırabilir ve sonra bu ağırlıkların test setinde nasıl performans gösterdiğini görebilirsiniz. Bir olasılık, deneme setinde hata yapmaya devam eden düşük kilolu doktorları ve belki de yüksek güvenle yapılan hafif kilolu teşhisleri sağlayan bir çeşit yöntemdir (güven, bu veri kümesindeki doğrulukla ilişkilidir).
Bu genel açıklamaya uyan çeşitli veri kümelerim var, bu nedenle örnek boyutları değişiyor ve tüm veri kümeleri doktorlar / hastalar ile ilgili değil. Bununla birlikte, bu özel veri kümesinde her biri 108 hasta gören 40 doktor bulunmaktadır.
DÜZENLEME: İşte @ jeremy-miles'nin cevabını okumamdan kaynaklanan bazı ağırlıklandırmalara bir bağlantı .
Ağırlıksız sonuçlar ilk sütunda bulunur. Aslında bu veri kümesinde, daha önce yanlışlıkla söylediğim gibi, maksimum güven değeri 5 değil, 5 idi. Böylece @ jeremy-miles'in yaklaşımını takiben herhangi bir hastanın alabileceği en yüksek ağırlıksız puan 7 olacaktır. Herhangi bir hastanın alabileceği en düşük ağırlıksız puan 0'dır, bu da her doktorun o hastanın kansere sahip olmadığına dair 4 güven seviyesiyle iddia ettiği anlamına gelir.
Cronbach Alpha tarafından ağırlıklandırma. SPSS'de genel olarak Cronbach Alfa'sının 0.9807 olduğunu buldum. Cronbach Alpha'yı daha manuel bir şekilde hesaplayarak bu değerin doğru olduğunu doğrulamaya çalıştım. Ben yapıştırmak 40 doktor, bir kovaryans matrisi oluşturulur burada . Sonra Cronbach Alfa formülü burada (burada doktorların ürün "in) öğelerin sayısı I hesaplanır kovaryans matrisi tüm çapraz elemanları toplanmasıyla ve tüm elemanları toplanmasıyla kovaryans matrisi. Sonra anladım Daha sonra her doktor doktordan alındığında ortaya çıkabilecek 40 farklı Cronbach Alpha hesapladım Veri kümesi. Cronbach's Alpha'ya sıfır katkıda bulunan herhangi bir doktora ağırlık verdim. Kalan doktorlar için Cronbach's Alpha'ya yaptıkları olumlu katkılarla orantılı olarak ağırlık buldum.
Toplam Madde Korelasyonlarına Göre Ağırlıklandırma. Tüm Toplam Öğe Korelasyonlarını hesaplıyorum ve daha sonra her doktoru korelasyonlarının boyutuyla orantılı olarak ağırlıklandırıyorum.
Regresyon Katsayılarına Göre Ağırlıklandırma.
Hala emin olmadığım bir şey, hangi yöntemin diğerinden "daha iyi" çalıştığını söylemek. Daha önce, Peirce Skill Score gibi ikili bir tahmin ve ikili bir sonucun olduğu durumlar için uygun olan şeyleri hesaplıyordum. Ancak, şimdi 0'dan 1 yerine 0'dan 7'ye kadar tahminlerim var. Tüm ağırlıklı puanları> 3,50'den 1'e ve tüm ağırlıklı puanları <3,50'den 0'a mı dönüştürmeliyim?
Cancer (4)
maksimum güven ile bir kanser tahminine No Cancer (4)
. Bunu söyleyemeyiz No Cancer (3)
ve Cancer (2)
aynıyız, ama bir süreklilik olduğunu söyleyebiliriz ve bu sürekliliğin orta noktaları Cancer (1)
ve No Cancer (1)
.
No Cancer (3)
olduğunuCancer (2)
? Bu, probleminizi biraz basitleştirecektir.