Ağırlıklı mi


19

MASS paketini Rkullanarak MM ağırlıkları ile sağlam bir doğrusal model tahmin ettim rlm(). `R`` bir sağlamaz model için değer, ama anlamlı bir miktar ise bir tane istiyorum. Ayrıca bir olan herhangi bir anlam olup olmadığını bilmek için ilgi am R 2 gözlem güçlü regresyon değerlendirildiler aynı şekilde toplam ve artan varyanslar ağırlığında değeri. Onlar aykırı bir şekilde, çünkü regresyon amacıyla, biz hesaplanması amacıyla belki o zaman, ağırlıklar tahminlerinin bazı daha az etkiye vererek esasen vardır eğer benim genel düşünce, yani r 2 biz de bu vermelidir aynı tahmin daha az etki?R2R2r2

Ben iki basit işlevleri yazdı ve ağırlıklı R 2 , onlar aşağıda belirtilmiştir. HI9 adı verilen modelim için bu işlevlerin çalıştırılmasının sonuçlarını da dahil ettim. DÜZENLEME: için bir formül verir UNSW Adelle Coster web sayfasını bulundu her iki hesaplamasını hesaplanmasında ağırlıklar vektörü içerir ve benim yaptığım gibi, ve daha resmi başvuru için sordum: http: //web.maths. unsw.edu.au/~adelle/Garvan/Assays/GoodnessOfFit.html (bu ağırlıklı r 2'nin nasıl yorumlanacağı konusunda Cross Validated'ten hala yardım arıyor .)R2R2R2SSeSStr2

#I used this function to calculate a basic r-squared from the robust linear model
r2 <- function(x){  
+ SSe <- sum((x$resid)^2);  
+ observed <- x$resid+x$fitted;  
+ SSt <- sum((observed-mean(observed))^2);  
+ value <- 1-SSe/SSt;  
+ return(value);  
+ }  
r2(HI9)  
[1] 0.2061147

#I used this function to calculate a weighted r-squared from the robust linear model
> r2ww <- function(x){
+ SSe <- sum((x$w*x$resid)^2); #the residual sum of squares is weighted
+ observed <- x$resid+x$fitted;
+ SSt <- sum((x$w*(observed-mean(observed)))^2); #the total sum of squares is weighted      
+ value <- 1-SSe/SSt;
+ return(value);
+ }
 > r2ww(HI9)
[1] 0.7716264

Buna cevap vermek için zaman harcayan herkese teşekkürler. Eğer özlediğim bu konuda çok iyi bir referans varsa veya yukarıdaki kodumu okumak zor ise (ben bir kod adam değilim) lütfen özürlerimi kabul edin.


ağırlıkları lm () içine koyun ve r-
karesini

1
daha verimli bir şekilde yaptığım işi yapmak için bir ipucu için teşekkürler. Herkes tarif ettiğim / önerdiğim ağırlıklı r kare anlamı hakkında yorum yapabilir mi?
CraigMilligan

@ user603: Ağırlıkları lm () içine nasıl koyarsınız?
histelheim

Sadece bir iltifat için, R'ye yerleştirilmiş en az ağırlıklı kare, toplamın (w * e ^ 2) en aza indirilmesidir, burada e, artıktır. Yani hesaplama kodu için, tüm ağırlık w bir kare kök alınmalıdır.
Yuanhao Lai

Ağırlıklı bir ortalama almamamız gerektiğini vurgulamak istiyorum, en azından inanıyorum ki yazdığım bir program 1'e yakın bir r-kare veriyor: klasik r-kare ağırlıklı r-kare ama ağırlıklı r- ile DEĞİL ortalama çok ağırlıklı nerede, ben bulmak -6 bile benim için karşı sezgisel, ama deneyim olsa inan karesi
pierre

Yanıtlar:


22

Aşağıdaki cevap şu şekildedir: (1) Willett ve Singer hakkındaki yorumum (1988) R-kare ile ilgili bir başka Dikkatli Not: Ağırlıklı en az kare regresyon analizinde kullanılır. Amerikalı İstatistikçi. 42 (3). pp236-238 ve (2) sağlam lineer regresyonun esasen, tekrarlı bir işlemle tahmin edilen ağırlıklarla ağırlıklı olarak en küçük kareler regresyonu olduğu öncülüdür.

R2w için soruda verdiğim formül, r2wls için Willet ve Singer'daki (1988) denklem 4'e karşılık gelen küçük bir düzeltmeye ihtiyaç duyuyor: SSt hesaplaması da ağırlıklı bir ortalama kullanmalıdır:

the correction is SSt <- sum((x$w*observed-mean(x$w*observed))^2)].

Bu (düzeltilmiş) ağırlıklı r kare'nin anlamı nedir? Bu varyasyon oranının bir ölçüsüdür "veri seti dönüştürülmüş [ağırlıklı] olarak belirlenmesi katsayısı. Willett ve Singer olarak yorumlar ağırlıklı ile açıklanabilir Y ağırlıklı X ve çıkış gibidir miktar R2, WLS regresyonu gerçekleştirildiğinde büyük istatistiksel bilgisayar paketleri tarafından ".

Uyum iyiliği ölçüsü olarak anlamlı mı? Bu, nasıl sunulduğu ve yorumlandığına bağlıdır. Willett ve Singer, sıradan en küçük kareler regresyonunda elde edilen r-kareden tipik olarak biraz daha yüksek olduğuna dikkat ediyor ve yüksek değer, belirgin bir gösterimi teşvik ediyor ... ancak bu ekran, geleneksel r -bölümlü ( ağırlıksız oranı olarak)varyasyon bir model tarafından açıklanmıştır). Willett ve Singer, daha az 'aldatıcı' bir alternatifin orijinal sorudaki r2 işlevime eşdeğer olan psödoR2wls (denklem 7) olduğunu öneriyorlar. Genel olarak, Willett ve Singer, tek bir uyum iyiliği ölçüsü olarak herhangi bir r2'ye (hatta yalancı2wl'lerine) güvenmenin iyi olmadığına da dikkat çekiyor. Bu uyarılara rağmen, sağlam regresyonun tüm dayanağı, bazı davaların 'iyi değil' olarak yargılanması ve model uyumunda fazla sayılmamasıdır ve bunu model değerlendirme sürecinin bir parçası olarak yansıtmak iyi olabilir. Ağırlıklı r-kare tarif olabilir tek uyum iyiliğinin iyi önlem - uzun doğru yorumlanması sunumda açıkça verilir ve uyum iyiliğinin tek değerlendirilmesi olarak itibar edilmez kadar.


1
(1). Cevabı koymak için zaman ayırdığınız için teşekkür ederiz.
user603

1

@CraigMilligan. olmamalı:

  • ağırlık kare parantezin dışında olmalıdır
  • ağırlıklı ortalama, bunun için de kullanabileceğimiz şekilde hesaplanırsum(x$w*observed)/sum(x$w)weighted.mean(observed,x$w)

Bunun gibi bir şey:

r2ww <- function(x){
  SSe <- sum(x$w*(x$resid)^2)
  observed <- x$resid+x$fitted
  SSt <- sum(x$w*(observed-weighted.mean(observed,x$w))^2)
  value <- 1-SSe/SSt;
  return(value);
}
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.