R cinsinden R cinsinden düzeltilmiş R-karesi formülü nedir ve nasıl yorumlanmalıdır?


35

Düzeltilmiş R-karesi için R'de kullanılan tam formül nedir lm() ? Bunu nasıl yorumlayabilirim?

Düzeltilmiş r-kare formülleri

Düzeltilmiş R-karesini hesaplamak için birkaç formül var gibi gözüküyor.

  • Kayık formülü: 1(1R2)(n1)(nv)
  • McNemar formül: 1(1R2)(n1)(nv1)
  • Rab formülü: 1(1R2)(n+v1)(nv1)
  • Stein'in formülü: 1[(n1)(nk1)(n2)(nk2)(n+1)n](1R2)

Ders kitabı açıklamaları

  • Field'ın ders kitabına göre, R'yi Kullanarak İstatistikleri Keşfetme (2012, s. 273) R, “örneğin, numunenin alındığı popülasyondan türetilmiş olması durumunda bize Y'de ne kadar varyansın hesaba kalacağını söyleyen” denklemini kullanır. Wherry formülü vermedi. Modelin ne kadar iyi geçerliliğini kontrol etmek için Stein'ın formülünü (elle) kullanmanızı önerir.
  • Kleiber / Zeileis, R ile Uygulamalı Ekonometri (2008, s. 59) "Theil'in düzeltilmiş R-karesi" olduğunu iddia ediyor ve yorumunun birden fazla R-karesinden nasıl farklılaştığını söylemiyor.
  • Dalgaard, R (2008, s. 113) ile Giriş İstatistikleri , “R kare değerini% 100 ile çarptığınızda,“% sapma azaltma ”olarak yorumlanabileceğini belirtir. Hangi formüle karşılık geldiğini söylemez.

Daha önce, R-kare'nin modele ek değişkenler eklemek için ceza verdiğini düşündüm ve çokça okudum. Şimdi bu farklı formüllerin kullanımı farklı yorumlar gerektiriyor. Ayrıca Stack Overflow ile ilgili bir soruya baktım ( Tek değişkenli en küçük kareler regresyonunda Çoklu R kare ve Düzeltilmiş R kare arasındaki fark nedir? ) Ve Wharton okulunun UPenn'deki istatistik sözlüğünde .

Sorular

  • R ile ayarlanan r-karesi için hangi formül kullanılır lm() ?
  • Bunu nasıl yorumlayabilirim?

8
summary.lm (): den ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)hesaplar burada ans $ r.squared = R ^ 2; n = n, rdf = artık df, df.int = kesişme df (0 veya 1).
EDi

Buradaki asıl soruna bir cevap vereceğim, ki bu "ne tür R ^ 2 ..." değil. Siz (ve diğerleri) eksik olan bilgi şudur: tüm R paketleri, hatta çekirdek, kaynak kodunu hazır bulundurur. Dağıtımlarda derlenen şeyler bile, CRAN'da veya başka bir depoda {packagenames} .tar.gz adresinde bulunabilir.
Carl Witthoft,

OP burada: Bu harika giriş için teşekkür ederiz. İkinci soruma ne dersiniz: Nasıl yorumlayabilirim? Adj’tan çok farklı yorumlar okudum. R-kare bazen Wherry's olmayabilir bir formüle dayanıyor gibi görünüyor?

Yanıtlar:


29

1. lmR'de ayarlanmış r-karesi için hangi formül kullanılır?

Daha önce de belirtildiği gibi, yazmak summary.lmsize R'nin ayarlanmış R karesini hesaplamak için kullandığı kodu verecektir. Alacağınız en alakalı çizgiyi çıkarmak:

ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)

Bu matematiksel gösterimde:

Radj2=1(1R2)n1np1

df.int=1nprdfn-p-1

npnp1

2. Neden bu kadar çok düzeltilmiş R-kare formülü var?

Radj2ρ2ρ2

R2Radj2

Radj2

Radj2ρ2ρ2R2

Referanslar

  • R2

9

İlk sorunuza ilişkin: Nasıl hesaplandığını bilmiyorsanız, koda bakın! Eğer yazarsanız summary.lmsizin konsolda, bu işlev için kodu almak. Eğer kod düşünce yağsız Eğer bir satır bulabilirsiniz: ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf). Bu satırın üstündeki bazı satırlara bakarsanız, şunu fark edeceksiniz:

  • ans$r.squaredR2
  • n Artıkların sayısı = Gözlem sayısı
  • df.int 0 veya 1 'dir (görüşmeniz varsa)
  • rdf artık df misin

R2R2

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.