Soruyu doğru şekilde çerçevelemek ve puanların yararlı bir kavramsal modelini benimsemek önemlidir.
Soru
55, 65 ve 85 gibi potansiyel hile eşikleri, verilerden bağımsız olarak a priori olarak bilinir : verilerden belirlenmeleri gerekmez. (Bu nedenle bu ne bir aykırı tespit problemi ne de bir dağıtım uydurma problemidir.) Test, bu eşiklerden biraz daha düşük bazı (hepsi değil) puanların bu eşiklere (veya belki de sadece bu eşiklerin üzerine) taşındığına dair kanıtları değerlendirmelidir.
Kavramsal model
Kavramsal model için, puanların normal bir dağılıma (veya kolayca parametreleştirilebilen başka bir dağılıma) sahip olmasının olası olmadığını anlamak çok önemlidir . Bu, yayınlanan örnekte ve orijinal rapordaki diğer tüm örneklerde bolca açıktır . Bu puanlar okulların bir karışımını temsil eder; herhangi bir okuldaki dağıtımlar normal olsa bile (öyle değiller), karışımın normal olması muhtemel değildir.
Basit bir yaklaşım, gerçek bir puan dağılımı olduğunu kabul eder: bu özel hile biçimi dışında rapor edilecek olan. Bu nedenle parametrik olmayan bir ayardır. Bu çok geniş görünüyor, ancak gerçek verilerde tahmin edilebilecek veya gözlemlenebilecek puan dağılımının bazı özellikleri var:
, ve puanlarının sayısı yakından ilişkilidir, .i−1ii+11≤i≤99
Skor sayımının idealize edilmiş pürüzsüz bir versiyonunun etrafında bu sayımlarda farklılıklar olacaktır. Bu varyasyonlar tipik olarak sayımın kare köküne eşit bir boyutta olacaktır.
Bir eşik göreli Hile herhangi puan için sayıları etkilemez . Etkisi, her puanın sayısıyla orantılıdır (hile yapması nedeniyle "risk altındaki" öğrenci sayısı). Bu eşiğin altındaki puanlar , sayısı bir miktar azaltılacak ve bu miktar eklenecektir .ti≥tic(i)δ(t−i)c(i)t(i)
Değişim miktarı, bir puan ile eşik arasındaki mesafe ile azalır: , değerinin azalan bir işlevidir .δ(i)i=1,2,…
eşiği verildiğinde , sıfır hipotezi (hile yok) , aynı olduğunu ima eder . Alternatif .tδ(1)=0δ0δ(1)>0
Test oluşturma
Hangi test istatistiği kullanılacak? Bu varsayımlara göre, (a) etki sayımlarda toplanır ve (b) en büyük etki eşiğin etrafında gerçekleşir. Bu sayıların ilk farklılıklarına bakıldığında . Daha fazla dikkate ayrıca bir adım daha önerir: alternatif hipotez altında, biz puan olarak giderek depresif sayımların bir dizi görmek için beklemek eşik yaklaşımlar alttan, daha sonra (i) en büyük pozitif bir değişiklik , (ii) a, ardından büyük negatif değişiklik . Testin gücünü en üst düzeye çıkarmak için, ikinci farklılıklara bakalım ,i t t t + 1c′(i)=c(i+1)−c(i)ittt+1
c′′(i)=c′(i+1)−c′(i)=c(i+2)−2c(i+1)+c(i),
çünkü bu, büyük bir negatif düşüş ile büyük bir pozitif artış negatifini birleştirecek ve böylece hile etkisini artıracaktır. .i=t−1c(t+1)−c(t)c(t)−c(t−1)
Eşiğin yakınındaki sayıların seri korelasyonunun oldukça küçük olduğunu varsayıyorum - ve bu kontrol edilebilir -. (Başka bir yerde seri korelasyon önemsizdir.) Bu, varyansının yaklaşık olarakc′′(t−1)=c(t+1)−2c(t)+c(t−1)
var(c′′(t−1))≈var(c(t+1))+(−2)2var(c(t))+var(c(t−1)).
Daha önce tüm için (ayrıca kontrol edilebilen bir şey önermiştim . Neredenvar(c(i))≈c(i)i
z=c′′(t−1)/c(t+1)+4c(t)+c(t−1)−−−−−−−−−−−−−−−−−−−−√
yaklaşık birim varyansa sahip olmalıdır. Büyük skor popülasyonları için (yayınlanan kişi yaklaşık 20.000 civarındadır), yaklaşık olarak normal bir dağılımı bekleyebiliriz . Hile modelini belirtmek için oldukça negatif bir değer beklediğimizden , standart Normal dağılımın cdf'si için : write boyutunda bir test kolayca elde edebiliriz , olduğunda eşiğinde hile yapılma hipotezini reddederiz .c′′(t−1)αΦtΦ(z)<α
Misal
Örneğin, üç Normal dağılımın bir karışımından oluşturulan bu doğru test puanları setini düşünün :
Buna tarafından tanımlanan eşiğinde bir hile programı uyguladım . Bu neredeyse tüm hile 65 veya hemen altında bir veya iki puan odaklanır:t=65δ(i)=exp(−2i)
Testin ne yaptığına dair bir fikir edinmek için , sadece değil, her skor için hesapladım ve skora karşı çizdim:zt
(Aslında, küçük sayımlarla ilgili sorunlardan kaçınmak için, önce paydasını hesaplamak için 0'dan 100'e kadar her sayıya 1 ekledim .)z
65'in yakınındaki dalgalanma, diğer tüm dalgalanmaların, bu testin varsayımlarına uygun olarak, yaklaşık 1 boyutta olma eğilimi açıktır. Test istatistiği, ve buna karşılık gelen p değeri , bu çok anlamlı bir sonuçtur. Sorudaki şekil ile görsel karşılaştırma, bu testin en az küçük bir p değeri döndüreceğini göstermektedir.z=−4.19Φ(z)=0.0000136
(Not olsa da, deney kendisi olmadığını lütfen değil fikirleri göstermek için gösterilen bu arsa kullanın. Test görünüyor sadece eşiğinde çizilen değerde, başka hiçbir yerde. Yine de böyle bir arsa oluşturmak iyi olurdu Test istatistiğinin hile puanı olarak gerçekten beklenen eşikleri belirlediğini ve diğer tüm puanların bu tür değişikliklere tabi olmadığını doğrulamak için Burada, diğer tüm puanlarda yaklaşık -2 ile 2 arasında dalgalanma olduğunu, ancak nadiren büyük bir ihtiyaç aslında hesaplama için bu arsa değerlerin standart sapmasını hesaplamak değil de o. Not, ve böylece birden fazla yerde dalgalanmaları şişirme efektleri hile ile ilişkili problemleri önler.)z
Bu testi birden fazla eşik değerine uygularken, test boyutunun bir Bonferroni ayarı akıllıca olacaktır. Aynı anda birden fazla teste uygulandığında ek ayarlama da iyi bir fikir olacaktır.
Değerlendirme
Bu prosedür, gerçek veriler üzerinde test edilene kadar ciddi şekilde önerilemez. İyi bir yol, bir test için puan almak ve test için eşik olarak kritik olmayan bir puan kullanmak olacaktır . Muhtemelen böyle bir eşik, bu hile biçimine maruz kalmamıştır. Bu kavramsal modele göre hile simülasyonu yapın ve simülasyon dağılımını inceleyin . Bu, (a) p değerlerinin doğru olup olmadığını ve (b) testin simüle edilmiş hile biçimini belirleme gücünü gösterecektir. Gerçekten de, değerlendirilen veriler üzerinde böyle bir simülasyon çalışması kullanılabilir ve testin uygun olup olmadığını ve gerçek gücünün ne olduğunu test etmek için son derece etkili bir yol sağlar. Çünkü test istatistiğizz bu kadar basit, simülasyonlar yapmak için pratik ve hızlı bir şekilde yürütmek olacaktır.