sonucunuz olan ve bunun bir dizi belirleyicisiyle nasıl ilişkili olduğu klasik bir veri analizi problemini düşünün . Burada akla gelen temel uygulama türü X, i 1 , . . . , X i p
, kentindeki suç oranı gibi grup düzeyinde bir sonuçtur .
Tahmini, şehir demografik özellikleri gibi grup düzeyinde özelliklerdir .
Temel amaç bir regresyon modeline uymaktır (belki rastgele etkilerle ama şimdilik bunu unutun):
Öngörücülerin biri (veya daha fazlası) her birim için farklı örnek boyutlarına sahip bir anketin sonucu olduğunda bazı teknik zorluklar ortaya çıkıyor mu? Örneğin, varsayalım kent için bir özet puanıdır şehirden bireylerin bir örnekten ortalama yanıttır ancak örnek bu ortalamalar dayanmaktadır boyutları çılgınca farklıdır: i i
Öngörücü değişkenlerin hepsi bir anlamda her şehir için aynı anlama sahip olmadığından, bu değişkenleri bir regresyon modelinde "eşit olarak yaratılmış" gibi koşullandırmanın bazı yanıltıcı çıkarımlara neden olabileceğinden korkuyorum.
Bu tür bir problem için bir isim var mı? Eğer öyleyse, bunun nasıl ele alınacağına dair araştırma var mı?
Benim düşüncem, bunu hata ile ölçülen bir öngörücü değişken olarak ele almak ve bu çizgiler boyunca bir şeyler yapmaktır, ancak ölçüm hatalarında heteroskedastisite vardır, bu yüzden çok karmaşık olacaktır. Bunu yanlış bir şekilde düşünüyor olabilirim veya bunu olduğundan daha karmaşık hale getirebilirdim, ancak buradaki herhangi bir tartışma yardımcı olacaktır.