Doğrusal regresyonda, genellikle birden fazla R ve R karesi alırız. Aralarındaki farklar nelerdir?
Doğrusal regresyonda, genellikle birden fazla R ve R karesi alırız. Aralarındaki farklar nelerdir?
Yanıtlar:
Büyük ( ) genellikle çoklu regresyon modelinde çoklu olmalıdır . İki değişkenli doğrusal regresyonda çoklu yoktur ve . Dolayısıyla bir fark uygulanabilirliktir: "çoklu " çoklu regresörleri ifade ederken, " " zorunlu olarak zorunlu değildir.r 2 R 2 R R 2 = r 2 R R 2
Başka bir basit fark yorumlamadır. Çoklu regresyon olarak, birden fazla olan çoklu korelasyon katsayısı olan kare ise, belirleme katsayısı . , bir şekilde iki değişkenli korelasyon katsayısı gibi yorumlanabilir , temel fark, çoklu korelasyonun, sadece bu iki değişkenli korelasyonların ortalaması değil, sadece herhangi birinin değil, bağımlı değişken ile öngörücülerin doğrusal bir kombinasyonu arasında olmasıdır. , bağımlı değişkente öngörücüler tarafından açıklanabilecek varyans yüzdesi olarak yorumlanabilir ; yukarıdaki gibi, bu sadece bir öngörücü varsa doğrudur.R R 2
Çoklu R aslında tepki ile takılan değerler arasındaki korelasyon olarak görülebilir. Bu nedenle her zaman olumludur. Çoklu R kare, kare versiyonudur.
Küçük bir örnek kullanarak açıklayayım:
set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)
fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared: 0.2347
(R <- cor(y, fitted(fit))) # 0.4845068
R^2 # 0.2347469
"Çoklu" etrafında büyük bir yaygara yapmaya gerek yoktur. Bu formül Anova ortamında bile her zaman geçerlidir. Sadece bir değişken olduğu durumda , eğim işaretli R, ile cevap arasındaki korelasyon ile aynıdır .X
Öğrencilerime şunu açıklıyorum:
çoklu R, korelasyon katsayısının (veya negatif işaretsiz korelasyon katsayısının) mutlak değeri olarak düşünülebilir!
R-karesi basitçe çoklu R'nin karesidir. Bağımsız değişken (ler) in neden olduğu varyasyon yüzdesi olarak olabilir.
Kavramı ve farkı bu şekilde kavramak kolaydır.