R neden NA'yı lm () katsayısı olarak verir?


32

lm()Finansal çeyrek için göstergeleri içeren bir veri kümesine bir model uyguluyorum (Q1, Q2, Q3, Q4'ü varsayılan yapar). Kullanarak lm(Y~., data = data) NAQ3 için bir katsayı olarak değer alıyorum ve tekilliklerden dolayı bir değişkenin dışlandığını belirten bir uyarı alıyorum .

Q4 sütunu eklemem gerekir mi?

Yanıtlar:


39

Bir regresyonda bir katsayı olarak NA, söz konusu değişkenin diğer değişkenlerle doğrusal olarak ilişkili olduğunu gösterir. Daki durumda, bu araçlarının bazıları için bir , b , c . Bu durumda, değişkenlerden birini düşürmeden regresyona benzersiz bir çözüm yoktur. Q 4 eklemek sadece işleri daha da kötüleştirecek.Q3=a×Q1+b×Q2+ca,b,cQ4


1
Katılıyorum ... kukla değişken tanımlarında bir sorun var gibi görünüyor.
Dominic Comtois

14
(1). NA daha genel olarak katsayının tahmin edilemez olduğu anlamına gelir. Bu, bahsettiğiniz gibi, tam bir eşliklilik nedeniyle olabilir. Ancak, ilgili parametreleri tahmin etmek için yeterli gözlem bulunmaması nedeniyle de olabilir (örneğin, eğer ). Öngörüler kategorikse ve etkileşim terimleri ekliyorsanız, bir NA aynı zamanda faktör düzeylerinin birleşimiyle ilgili gözlem olmadığı anlamına da gelebilir. p>n
Makro

2
p>n

Değişkenler doğrusal olarak ilişkili değildir, çünkü Q3 = 1, Q1 = Q2 = 0. Dahası, stepAIC () kullanmak ve modeli bu değişkenlerin üçünü de dahil etmeye zorlamak sorun yaratmaz. Ayrıca, kabaca 3x var değişkenlere gözlem sayısı. En iyi tahminim, Q3 ile bazı diğer değişkenler arasında eş anlamlılık olduğu, sanırım StepAIC tarafından dahil edilmemiş.
Fraijo
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.