Hem klasik test teorisi (CTT) hem de madde yanıt teorisi (IRT), hangi öğelerin ölçmek istediğiniz gizli özelliğe katkıda bulunduğunu, hangilerinin desteklemediği konusunda rehberlik sağlayabilir. CTT ile, 1) madde zorluğu, 2) toplam puanla madde korelasyonu, 3) madde varyansı ve 4) öğe kaldırılırsa iç tutarlılık tahminleri üzerindeki etkiyi (örneğin, Cronbach alfa) düşünün.
Çok kolay veya çok zor olan nesneler konuyu ayırmaya yardımcı olma eğilimindedir (yüksek puan alanlar ve düşük puan alanlar arasında ayrım yapma). En iyi performans gösterenler arasındaki farkları ölçmeyle ilgilenmiyorsanız, kaldırılması için çok zor sorular düşünülmelidir. Benzer bir şekilde, çok kolay ürünler sadece düşük performans gösterenlerin performansıyla ilgileniyorsanız uygundur.
Tüm öğeler toplam puanla pozitif korelasyon göstermelidir ve bu korelasyon için 0.20 civarında bir alt sınır ayarlayabilirsiniz. Düşük korelasyonlar veya negatif korelasyonlar, anketinizde ifade problemleri olduğunu ve sorunun ters çevrilmesi gerektiğini gösterebilir.
Varyansları düşük (puanların değişkenliği) olan maddeler, konuları ayırmadıkları ve anketten toplanan bilgilere katkıda bulunmadıkları için kaldırılmaları düşünülmelidir. Çok yüksek değişkenliğe sahip öğeler, ölçmek istediğiniz yapı / özellikten başka bir şey ölçüyor olabilir.
İç tutarlılık tahmini, öğe kaldırıldığında iyileşirse, öğenin kaldırılması veya yeniden ifade edilmesi düşünülmelidir.
Herkesin düzelttiği öğeler bazen maksimum öğelerdir ve herkesin yanlış yaptığı öğeler bazen minimum öğeler olarak adlandırılır. Toplamaya çalıştığınız bilgilere katkıda bulunmazlar.
Yüksek miktarda bir anket geliştiriyorsanız veya anketi pazarlamayı planlıyorsanız, kesinlikle IRT'yi düşünmelisiniz. Ancak, geniş bir konu alanıdır ve gerçekten ilgilenmediğiniz sürece, muhtemelen buraya girmeye değmez.
Bu yardımcı olur umarım.