R kare ne zaman negatif olur?


77

Anladığım kadarıyla , karesi olduğu için negatif olamaz. Ancak, tek bir bağımsız değişken ve bağımlı değişken olan SPSS'de basit bir doğrusal regresyon yaptım. SPSS çıkışım bana için negatif bir değer verir . Bunu R'den elle hesaplamak isteseydim, pozitif olurdu. Bunu negatif olarak hesaplamak için SPSS ne yaptı?R2R2R2

R=-.395
R squared =-.156
B (un-standardized)=-1261.611

Kullandığım kod:

DATASET ACTIVATE DataSet1. 
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA 
           /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN 
           /DEPENDENT valueP /METHOD=ENTER ageP

Olumsuz bir değer alıyorum. Bunun ne anlama geldiğini açıklayan var mı?

Negatif RSquared

görüntü tanımını buraya girin


3
Bu sorunuza cevap veriyor mu? stats.stackexchange.com/questions/6181/… Eğer değilse, o zaman lütfen daha fazla bilgi verin: bu, hangi prosedürün "SPSS çıktısı" dır?
whuber

2
Doğrusal regresyon modelinizde bir engel var mı?
NPE

2
@Anne Yine, hangi SPSS prosedürünü kullanıyorsunuz?
whuber

1
@Anne, zaman serisi yanıtını dikkate almamanızı öneririm, çünkü verileriniz zaman serisi değildir ve bir zaman serisi prosedürü kullanmıyorsunuzdur. R karesinin negatif bir değer olarak verildiğinden emin misiniz? Büyüklüğü doğrudur: . SPSS'ye, belki de bir konvansiyonel olarak negatif R'ler için R-kare değerinin ihmal edilip edilmediğini görmek için baktım, ancak bunun böyle olduğuna dair herhangi bir kanıt göremiyorum. Belki de R-karesini okuduğunuz çıktının ekran görüntüsünü gönderebilirsiniz? (0.395)2=0.156
whuber

1
Bağımlı değişken evlerin fiyatıdır, bu nedenle% 95 CI belki 120.000 olabilir. Ne yazık ki, veri kullanım koşullarına aykırı olacağı için verileri buraya gönderemiyorum.
Anne,

Yanıtlar:


106

R2 , seçilen modelin uyumunu yatay bir düz çizgininkiyle (boş hipotez) karşılaştırır. Seçilen model yatay çizgiden daha kötüye giderse, negatiftir. her zaman bir şeyin karesi olmadığını unutmayın , bu nedenle matematik kurallarını ihlal etmeden negatif bir değeri olabilir. yalnızca seçilen model verilerin eğilimini takip etmediğinde negatiftir, bu nedenle yatay çizgiden daha kötü durumdadır.R2R2R2

Örnek: engelinin değerine eşit olması gereken şekilde kısıtlanan doğrusal regresyon modeline verileri sığdırmak .Y1500

görüntü tanımını buraya girin

Bu veriler verilen modelin hiçbir anlamı yoktur. Açıkçası yanlış bir model, belki de kazayla seçilmiş.

Modelin sığması (noktadan geçmek için kısıtlanmış düz bir çizgi (0,1500)) yatay bir çizginin sığmasından daha kötüdür. Bu nedenle, modeldeki kareler toplamı , yatay satırdaki kareler toplamından daha büyüktür . , olarak hesaplanır . Tüm büyüktür , bu denklem için negatif bir değer hesaplar .(SSreg)(SStot)R21SSregSStotSSregSStotR2

Kısıtlamaları olmayan lineer regresyonda, pozitif (veya sıfır) olmalı ve korelasyon katsayısının karesine eşittir, . Negatif bir yalnızca kesişim veya eğim sınırlandırıldığında doğrusal regresyon ile mümkündür, böylece "en uygun" çizgi (kısıtlama göz önüne alındığında) yatay bir çizgiden daha iyi uyuyor. Doğrusal olmayan regresyonda, en uygun model (seçilen denklem verildiğinde ve varsa kısıtlamaları) yatay bir çizgiden daha kötü veriye uyduğunda negatif olabilir.R2rR2R2

Alt satır: negatif bir matematiksel olarak imkansızlık veya bilgisayar hatalarının işareti değildir. Bu sadece seçilen modelin (kısıtlamaları ile birlikte) verilere gerçekten uygun olduğu anlamına gelir.R2


3
@JMS Googling'imin gösterdiğinin tam tersi: "/ ORIGIN" engellemeyi 0 olarak düzeltir; "/ NOORIGIN" ", SPSS'e sabitini bastırmamasını söyler" ( Windows için
SPSS'e

10
@whuber Doğru. @ harvey-motulsky Negatif bir R ^ 2 değeri , normal OLS regresyonu için (bir kesişme ile) matematiksel olarak imkansızdır (ve bir bilgisayar hatası olduğunu gösterir). 'REGRESYON' komutunun yaptığı ve asıl posterin sorduğu şey budur. Aynı zamanda, en küçük kareler regresyon analizi için, R ^ 2 olduğu tahmin edilen ve gözlenen değerler arasındaki karesi alınmış korelasyon. Bu nedenle negatif olmamalıdır. Bir öngörücüyle basit OLS regresyonu için, bu yordayıcı ile bağımlı değişken arasındaki kare korelasyona eşdeğerdir - yine, negatif olmamalıdır.
Wolfgang

1
@whuber Indeed. Benim hatam; Açıkçası SPSS kullanmıyorum - ya da okudum, görünüşe göre :)
JMS

1
@whuber. Doğrusal regresyon ile R2'nin sadece kesişme (veya eğim) kısıtlandığında negatif olabileceğine işaret eden bir paragraf ekledim. Kısıtlama olmadan, R2 pozitif olmalıdır ve korelasyon katsayısı olan r'nin karesine eşittir.
Harvey Motulsky,

1
@ HarveyMotulsky, bu durumda kesişme veya eğim kısıtlı değildi. Görünüşe göre Rsquared'in ancak bunlar kısıtlanırsa negatif olabileceğini söylüyorsunuz. Bu özel olayda neler olmuş olabileceği hakkında detaylı bilgi verebilir misiniz?
Anne,

18

Regresyonunuza bir engelleme eklemeyi mi unuttunuz? SPSS kodunu bilmiyorum ama Hayashi'nin Ekonometri'sinin 21. sayfasında:

Eğer regresörler sabit içermezlerse (bazı regresyon yazılım paketlerinin yaptığı gibi) yine de formülle hesaplarsınız.R2

R2=1i=1nei2i=1n(yiy¯)2

o zaman negatif olabilir. Bunun nedeni, bir kesişmenin yararı olmadan, regresyonun bağımlı değişkenin izlenmesi açısından örnek ortalamasından daha kötü yapabileceğidir (yani pay, paydadan daha büyük olabilir).R2

SPSS'in regresyonunuza bir engelleme dahil edip etmediğini kontrol eder ve emin olurdum.


4
Kodundaki NOORIGIN alt komutu, müdahale modeline dahil edildiğini söylüyor
ttnphns

2
bu tuhaf. Bunun, kesişmenin NOORIGINmodele dahil edilmediği, sadece isminden çıkacağı anlamına geleceğini tahmin ederdim.
Matt O'Brien

6

Bu, Niid olan bir zaman diziniz varsa ve sapmadan sonra varyansı (kareler toplamı - SSE) olan ilk fark rastgele yürüme modeli olan formun uygun olmayan bir ARIMA modelini (0,1,0) oluşturduysanız bu olabilir. Artıkların sayısı, orijinal serinin varyansından (toplam SSO kareleri) daha büyük olacaktır. Böylece 1-SSE / SSO denklemi, SSE SSO'yu aşan negatif bir sayı verecektir. Bunu, kullanıcılar sadece varsayılan bir modele uyarsa veya uygun bir ARIMA yapısını tanımlamak / oluşturmak için yetersiz prosedürler kullandığında gördük. Daha büyük mesaj, bir modelin vizyonunuzu bozabileceği (bir çift kötü gözlük gibi). Verilerinize erişiminiz olmasaydı, aksi halde hatalı sonuçlarınızı açıklamada bir problem olur. Bunu IBM'in dikkatine mi getirdiniz?

Üretken olduğu varsayılan bir model fikri Harvey Motulsky tarafından yankılandı. Harika yazı Harvey!


1
istatistik. Teşekkürler. Hayır IBM ile konuşmadım. Veri zaman serisi değil. Zaman içindeki verilerden geliyor.
Anne,

5
@Anne ve diğerleri: Verileriniz zaman serisi olmadığından ve bir zaman serisi prosedürü kullanmadığınız için lütfen cevabımı dikkate almayın. Zaman serileriyle ilgili olumsuz R Kareleri gözlemleyenler görevimi ilginç ve teğetsel olarak bilgilendirici bulabilirler. Diğerleri ne yazık ki olmayabilir.
IrishStat

@IrishStat: Lütfen Harvey Motulsky gönderisine bir link ekler misiniz?
kjetil b halvorsen

Harvey soruyu burada cevapladı.
IrishStat,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.