Modele rastgele terimler eklemek, notlar arasındaki bazı kovaryans yapısını indüklemenin bir yoludur. Okul için rasgele faktör, aynı okuldaki farklı öğrenciler arasında sıfırdan farklı bir kovaryansa neden olurken , okul farklı olduğunda .0
Diyelim olarak modelinizi yazmak
ler indeksleri okul ve i (her okulda) öğrencileri endeksler. Terimleri , okul s bir çizilmiş bağımsız rastgele değişkenler N ( 0 , τ ) . E s , ı bir çizilmiş bağımsız rastgele değişkenler N ( 0 , σ
Ys , ben= α + saats , benβ+ okuls+ es , ben
sbenokulsN-( 0 , τ)es , ben .
N-( 0 , σ2)
Bu vektör, beklenen tüm değerler
çalışılan saat sayısına göre belirlenir.
[ α + saats , benβ]s , ben
Arasındaki kovaryans ve Y ler ' , i ' ise 0 iken s ≠ lar ' , hangi öğrencilerin aynı okulda olmadığında beklenen değerlerden notlarının kalkış bağımsız olduğunu demektir.Ys , benYs', ben'0s ≠ s'
Arasındaki kovaryans ve Y ler , i ' olduğunu τ zaman i ≠ i ' ve varyansını Y ler , i olan den aynı okuldan öğrencilerin notlarının korelasyon olacak kalkışlar: beklenen değerleri.Ys , benYs , ben'τi≠i′Ys,iτ+σ2
Örnek ve simüle edilmiş veriler
İşte beş okuldan elli öğrenci için kısa bir R simülasyonu (burada alıyorum ); değişkenin isimleri kendi kendini belgelemektedir: σ2=τ=1
set.seed(1)
school <- rep(1:5, each=10)
school_effect <- rnorm(5)
school_effect_by_ind <- rep(school_effect, each=10)
individual_effect <- rnorm(50)
Her bir öğrenci için beklenen , yani terimleri , her bir okul için ortalama kalkış ile birlikte (noktalı çizgi) :schools+es,i
plot(individual_effect + school_effect_by_ind, col=school, pch=19,
xlab="student", ylab="grades departure from expected value")
segments(seq(1,length=5,by=10), school_effect, seq(10,length=5,by=10), col=1:5, lty=3)
Şimdi bu konu hakkında yorum yapalım. Her noktalı çizginin seviyesi ( karşılık gelir ) normal bir yasada rastgele çizilir. Öğrenciye özgü rastgele terimler de normal bir yasada rastgele çizilir, noktaların noktalı çizgiden uzaklığına karşılık gelir. Ortaya çıkan değer, her öğrenci için, çalışmak için harcanan zamana göre belirlenen not olan . Sonuç olarak, aynı okuldaki öğrenciler, sorunuzda belirttiğiniz gibi, farklı okullardaki öğrencilerden daha benzerdir. α + saat pschoolsα+hoursβ
Bu örnek için varyans matrisi
Yukarıdaki simülasyonlarda, okul efektleri ve bireysel etkileri ayrı ayrı , bu yüzden başladığım kovaryans düşünceleri burada açıkça görünmüyor. Aslında, blok diyagonal kovaryans matrisi ile 50. boyutta rastgele normal bir vektör çizerek benzer sonuçlar elde ederdik.
burada beş blok , aynı okulun öğrencileri arasındaki kovaryansa karşılık gelir:
schoolses,i
⎡⎣⎢⎢⎢⎢⎢⎢A00000A00000A00000A00000A⎤⎦⎥⎥⎥⎥⎥⎥
10×10AA=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢2111111111121111111111211111111112111111111121111111111211111111112111111111121111111111211111111112⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥.