Diğer şeylerin yanı sıra öğrencilere annelerinin eğitim seviyelerinin sorulduğu geniş bir anketim var. Bazıları atladı ve bazıları yanlış cevapladı. Bunu biliyorum, çünkü ilk yanıt verenlerin bir alt örneği daha sonra anneler ile görüşülmüş ve aynı soruyu sordular. (Eminim annelerin tepkileriyle ilgili daha küçük bir miktar hata vardır.)
Zorluğum, bu ikinci, daha güvenilir veri kaynağından en iyi şekilde nasıl yararlanacağına karar vermektir. En azından eksik verileri yalnızca tam vakalara güvenebileceğimden daha akıllıca ima etmek için kullanabilirim. Ancak, verileri çapraz kontrol edebildiğim, "Annem ilkokulu hiç bitirmedi" şeklinde cevap veren çocukların 3 / 4'ü annelerinin cevabıyla çelişiyorsa, oradaki belirsizliği yakalamak için birden fazla veri kümesi oluşturmak için itham kullanmalıyım gibi görünüyor. [ekledi: Bir noktaya değmek için 3/4 dedim, ama şimdi verileri kontrol ettiğim için, size% 40'a yakın olanın tutarsız olduğunu söyleyebilirim]
Ben şahsen annenin eğitimini karma bir modelde bir yordayıcı olarak kullanacağım, ancak herhangi birinin başka durumlar hakkında söyleyecek bir şeyi varsa, bunları da öğrenmek isterim.
Geniş darbelerde veya ayrıntılarda tavsiye almak isterim. Teşekkür ederim!
Güncelleme : Will ve Conjugate_Prior'ın yanıtlarını takdir etsem de şimdilik bu soruyu çözümsüz bırakıyorum, daha spesifik ve teknik geri bildirim umudunu veriyorum.
Aşağıdaki dağılım grafiği, her iki değişkenin de bulunduğu 10.000 vakada iki değişkenin nasıl ilişkili olduğu hakkında bir fikir verecektir. 100'den fazla okulda yuvalanmışlardır. Bunlar 0.78 ile ilişkilidir, Öğrenci Yanıtı - ortalama: 5.12 sd = 2.05, Annenin yanıtı, ortalama = 5.02, sd = 1.92 Öğrencilerin cevabı vakaların yaklaşık% 15'inde eksiktir.