Ben bir "saygı metni" in yanı sıra başka CV kullanıcıyı iki çelişen biraz süklüm püklüm hissediyorum rağmen, Spearman-Brown formülü olduğunu bana öyle geliyor değil zorluk farklı öğeleri içeren etkilenir. Elbette, Spearman-Brown formülü genellikle paralel öğelere sahip olduğumuz varsayımı altında türetilir , bu da (diğer şeylerin yanı sıra) öğelerin eşit zorlukta olduğunu ima eder. Ancak bu varsayımın gerekli olmadığı ortaya çıkıyor; eşitsiz zorluklara izin vermek için rahatlayabilir ve Spearman-Brown formülü hala geçerli olacaktır. Bunu aşağıda gösteriyorum.
Klasik test teorik olarak, bir ölçüm olduğunu hatırlayın bir "gerçek puan" bileşen toplamı olduğu varsayılır ve bir hata bileşeni olduğu,
ile ve ilintisiz. Paralel kalemlerin varsayımı, tüm öğelerin eşit hatalara sahip olduğu varsayılmakla birlikte, yalnızca hata bileşenlerinde farklılık gösteren aynı gerçek puanlara sahip olmasıdır. Sembollerde, ve öğelerinin herhangi bir çifti için ,
XTE
X=T+E,
TEXX′T=T′var(E)=var(E′).
İlk varsayımı rahatlattığımızda neler olacağını görelim, böylece öğeler zorluklarında farklılık gösterebilir ve daha sonra bu yeni varsayımlar altında toplam test puanının güvenilirliğini elde edebiliriz. Özellikle, gerçek puanların bir katkı sabitiyle farklılık gösterebileceğini, ancak hataların hala aynı varyansa sahip olduğunu varsayın. Sembollerde,
Zorluktaki herhangi bir fark katkı sabiti tarafından yakalanır. Örneğin, , daha sonra puanları ilgili puan daha yüksek olma eğilimi ve böylece, "daha kolay" bir . Bunlara
esasen paralel diyebiliriz
T=T′+c′var(E)=var(E′).
c′>0XX′XX′benzer bir şekilde tau eşdeğeri modeli gevşeten "temel tau eşdeğerliği" varsayımına benzer şekilde.
Şimdi bu tür öğelerin bir test formunun güvenilirliğini elde etmek için. Toplamı test puanını veren temelde paralel kalemlerden oluşan bir testi düşünün . Güvenilirlik, tanım gereği, gerçek skor varyansının gözlemlenen skor varyansına oranıdır. Tek tek öğelerin güvenilirliği için, temel paralellik tanımından, , ile belirttiğimiz aynı güvenilirliğe sahip oldukları , gerçek puan varyansı ve hata varyansıdır. Toplam test puanının güvenilirliği için önce toplam test puanının varyansını inceliyoruz;
kρ=σ2T/(σ2T+σ2E)σ2Tσ2E Tσ 2 T σ 2 E k 2 σ 2 T
var(∑i=1kTi+Ei)=var(∑i=1kT+ci+Ei)=k2σ2T+kσ2E,
(herhangi bir simge) her ürün gerçek skorları, sabit bakımından ile kaydırılabilir olduğu rasgele doğru skor, olduğu gerçek puan varyansı ve hata varyansıdır. Sabit terimlerin ayrıldığına dikkat edin! Bu anahtar. Bu durumda toplam test puanının güvenilirliği
Tσ2Tσ2Ek2σ2Tk2σ2T+kσ2E=kσ2Tkσ2T+σ2X−σ2T=kρ1+(k−1)ρ,
sadece klasik Spearman-Brown formülü, değişmeden. Bu, ortalama puanları olarak tanımlanan öğelerin "zorluğunu" değiştirirken bile, Spearman-Brown formülünün hala geçerli olduğunu göstermektedir.
@JeremyMiles, "gerçek dünyada" test uzunluğunu artırdığımızda neler olabileceğiyle ilgili bazı ilginç ve önemli noktalar ortaya çıkarıyor, ancak en azından klasik test teorisinin idealleştirilmiş varsayımlarına göre, madde zorluğundaki değişiklikler, test formu (modern Öğe Yanıt Teorisinin varsayımlarına tam tersine!). Aynı temel akıl yürütme çizgisi, genellikle tau-denklik yerine temel tau-denklikten bahsettiğimiz için de önemlidir, çünkü önemli sonuçların çoğu, madde zorluklarının (yani araçların) farklı olabileceği daha yumuşak bir durum için geçerlidir.