Tüm bağımsız değişkenlerin (yaklaşık 400) kukla değişkenler olduğu büyük bir OLS regresyonu yürütüyorum. Tüm dahil edilirse, mükemmel çoklu bağlantı (kukla değişken tuzağı) vardır, bu yüzden regresyonu çalıştırmadan önce değişkenlerden birini atlamalıyım.
İlk sorum şu, hangi değişken atlanmalıdır? Birkaç gözlemde mevcut olandan ziyade, gözlemlerin çoğunda mevcut olan bir değişkeni atlamanın daha iyi olduğunu okudum (örneğin, neredeyse tüm gözlemler "erkek" veya "kadın" ve sadece birkaçı "bilinmiyorsa" "," erkek "veya" kadın "ifadesini atlayın). Bu haklı mı?
Regresyonu atlanan bir değişkenle çalıştırdıktan sonra, atlanan değişkenin katsayı değerini tahmin edebiliyorum, çünkü tüm bağımsız değişkenlerimin toplam ortalamasının 0 olması gerektiğini biliyorum. Bu nedenle, bu gerçeği katsayı değerlerini tüm dahil edilen değişkenleri içerir ve atlanan değişken için bir tahmin alır. Bir sonraki sorum atlanan değişkenin katsayı değeri için standart hatayı tahmin etmek için kullanılabilecek benzer bir teknik olup olmadığıdır. Olduğu gibi, başlangıçta atlanan değişkenin katsayısı için standart bir hata tahmini elde etmek amacıyla farklı bir değişkeni (ve ilk regresyonda atladığım değişken dahil) regresyonu yeniden çalıştırmak zorundayım.
Son olarak, elde ettiğim katsayı tahminlerinin (sıfır etrafında yeniden ortaladıktan sonra) hangi değişkenin çıkarıldığına bağlı olarak biraz değiştiğini fark ettim. Teorik olarak, her biri farklı bir değişkeni atlayan birkaç regresyon çalıştırmak ve daha sonra tüm regresyonlardan katsayı tahminlerini ortalamak daha iyi olur mu?