Doğrusal regresyon öngörücüsü eklemek R karesini azaltır


10

Veri kümem ( ) bağımlı bir değişkene (DV), beş bağımsız "temel" değişkene (P1, P2, P3, P4, P5) ve bir bağımsız ilgi değişkenine (Q) sahiptir.N-10,000

Aşağıdaki iki model için OLS doğrusal regresyonlarını çalıştırdım:

DV ~ 1 + P1 + P2 + P3 + P4 + P5
                                  -> R-squared = 0.125

DV ~ 1 + P1 + P2 + P3 + P4 + P5 + Q
                                  -> R-squared = 0.124

Yani, prediktör Q'nun eklenmesi, lineer modelde açıklanan varyans miktarını azaltmıştır. Anladığım kadarıyla bu olmamalı .

Açık olmak gerekirse, bu R-kare değerleri ve vardır değil düzeltilmiş R kare değerleri.

Jasp ve Python'un istatistik modellerini kullanarak R-kare değerlerini doğruladım .

Bu fenomeni görmem için bir sebep var mı? Belki OLS yöntemi ile ilgili bir şey?


1
sayısal sorunlar? Sayılar birbirine oldukça yakın ...

@ user2137591 Ben böyle düşünüyorum, ama bunu nasıl doğrulayacağımı bilmiyorum. R-kare değerleri mutlak fark küçüktür ,000513569 olduğu, ancak bu küçük.
Cai

1
Umarım lineer cebiri bilirsiniz: X Yukarıdakilerin tasarım matrisi, lütfen hesaplayabilir misiniz? detXTX, burada matris devrik ve matris belirleyicidir? Tdet
Klarnetçi

8
Eksik değerler otomatik olarak düşüyor mu?
generic_user

1
0.000513569 çok küçük bir sayıdır: yüzde 0.41 değişikliktir. Büyük olasılıkla sayısal bir konudur. Clarinetist'in söylemeye çalıştığı şey, belki de tasarım matrisinizin kötü bir durum numarasına sahip olması ve ters çevirirken sayısal olarak kararsız olmasıdır ...

Yanıtlar:


25

QOtomatik olarak bırakılan eksik değerleriniz olabilir mi? Bunun örnek üzerinde etkileri olacak ve iki gerilemeyi karşılaştırılamaz yapacaktı.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.