GLM'ler için sahte R kare formülü


Yanıtlar:


22

GLiM'ler için çok sayıda sahte s vardır. Mükemmel UCLA istatistikleri yardım sitesi burada bunlara kapsamlı bir genel bakış sunuyor . Listede bulunduğunuz kişi McFadden'in takma adı . UCLA'nın tipolojisine göre, takılı modelin boş model üzerindeki gelişimini indekslemesi anlamında gibidir . Eğer doğru geri çağırmak Bazı istatistiksel yazılım, özellikle SPSS, McFadden en yalancı çıktısını Ben oldukça yaygındır şüpheli yüzden, lojistik regresyon gibi bazı analizler sonuçlarıyla varsayılan olarak Cox & Snell ve Nagelkerke yalancı rağmen s daha da fazla olabilir. Ancak, McFadden'ın takma adı tüm özelliklere sahip değil.R2R2R2R2R2R2R2 (sözde - yok). Birisi bir modeli anlamak için bir sahte- kullanmakla ilgileniyorsa, bu mükemmel CV konusunu okumanı şiddetle tavsiye ediyorum: Hangi gerileme- , lojistik regresyon için rapor edilecek ölçüt (Cox & Snell veya Nagelkerke)? (Buna değer olarak, kendisi insanların bildiğinden daha kaygandır, burada @ whuber'ın cevabında büyük bir gösteri görülebilir: yararlı yoksa tehlikeli midir? ) R2R2R2R2R2


Tüm bu sözde R2'lerin sadece lojistik regresyon için özel olarak tasarlanıp tasarlanmadığını merak ediyorum. Yoksa poisson ve gamma glms için de genelleştiriyorlar mı? Her mümkün GLM için farklı R2 formülü buldumColin Cameron, A., & Windmeijer, F. A. (1997). An R-squared measure of goodness of fit for some common nonlinear regression models. Journal of Econometrics, 77(2), 329-342.
Jens

@Jens, bazıları kesinlikle LR'ye özgü görünüyor, ancak bazıları herhangi bir GLiM'den alabileceğiniz sapmayı kullanıyor.
dediklerinin - Eski Monica

1
McFadden'in 2'sinin sıklıkla OP'nin sorusundaki sapmaya göre değil, yalnızca bir katkı sabitine kadar tanımlanmış log olasılığı ile tanımlandığını unutmayın. Katkı sabiti spesifikasyonu olmadan, McFadden's iyi tanımlanmamıştır. Sapma, genellemenin doğrusal modellerden ile karşılaştırılabilir olması durumunda aklımda en uygun seçenek olan benzersiz bir sabit seçimdir . R 2 R 2R2R2R2
NRH

GLM'lerin, bwlewis.github.io/GLM'de olduğu gibi yinelenen en küçük kareler kullanılarak uygun olduğu göz önüne alındığında , GLM bağlantı ölçeğinde ağırlıklı bir R2'nin hesaplanmasının sakıncası ne olurdu, GLM bağlantı ölçeğinde ağırlıklı bir R2'nin hesaplanmasının sakıncası ne olurdu? bir glm uygun yuvadaki ağırlıkları)?
Tom Wenseleers,

@TomWenseleers, istediğiniz gibi yapabilirsiniz, ancak temel argümanlar, bağlı olduğum "Hangi sözde- ... ... ... bildirilecek ..." başlığında, özellikle olasılıkbilimbiliminin cevabında . R2
gung - Reinstate Monica

9

R, glmtam olarak bu tür bir karşılaştırma yapabilmeniz için çıktıda boş ve artık sapma verir (aşağıdaki son iki satıra bakın).

> x = log(1:10)

> y = 1:10

> glm(y ~ x, family = poisson)

>Call:  glm(formula = y ~ x, family = poisson)

Coefficients:
(Intercept)            x  
  5.564e-13    1.000e+00  

Degrees of Freedom: 9 Total (i.e. Null);  8 Residual
Null Deviance:      16.64 
Residual Deviance: 2.887e-15    AIC: 37.97

Ayrıca birlikte nesnenin dışarı bu değerleri çekebilir model$null.deviancevemodel$deviance


Ah tamam. Sadece soruyu yazılı olarak cevaplıyordum. Daha fazlasını eklerdim, ama sıfır sapmanın kendimce nasıl hesaplandığından% 100 emin değilim (doymuş bir modelin kütük olasılığı ile ilgisi var, ancak doygunluğa ilişkin detayların kendinden emin olması için yeterince hatırlamıyorum. iyi sezgiler verebilirdim ki)
David J. Harris

Ben glm çıktısında yok (aile mülkiyeti ya da quasipoisson).
Meraklı

@ Tomas düzenlemelerimi görüyor. 2 yıl önce hatalı mıydım, yoksa varsayılan çıktı o zamandan beri değişti mi bilmiyorum.
David J. Harris

Tomas bilgi tarafından üretiliyor summary.glm. Bir tanımının ortak olup olmadığına gelince, bir tür anket gerektirir. Daha önce de görmüş olduğum için, özellikle yaygın olmayan bir şey değil, özellikle nadir olmadığını söyleyebilirim. R2
Glen_b

1
Soruyu okuyun. Cevap verdiğini düşünüyor musun? Soru, "formülün bileşenlerini nereden alabilirim?" Değildi.
Meraklı

6

Önerdiğiniz formül, lojistik modelde R karesini tahmin etmek için Maddala (1983) ve Magee (1990) tarafından önerilmiştir. Bu nedenle, tüm glm modellerine uygulanabilir olduğunu sanmıyorum (bkz. Thomas P. Ryan tarafından Modern Regresyon Yöntemleri, sayfa 266).

Sahte bir veri seti yaparsanız, örneğin Gaussian glm için R karesinin hafife alındığını göreceksiniz.

Sanırım bir gaussian glm için temel (lm) R kare formülü kullanabilirsiniz ...

R2gauss<- function(y,model){
    moy<-mean(y)
    N<- length(y)
    p<-length(model$coefficients)-1
    SSres<- sum((y-predict(model))^2)
    SStot<-sum((y-moy)^2)
    R2<-1-(SSres/SStot)
    Rajust<-1-(((1-R2)*(N-1))/(N-p-1))
    return(data.frame(R2,Rajust,SSres,SStot))
}

Lojistik (veya r 'deki binom aile) için önerdiğiniz formülü kullanırdım ...

    R2logit<- function(y,model){
    R2<- 1-(model$deviance/model$null.deviance)
    return(R2)
    }

Şimdiye kadar poisson glm için bu yazıdaki denklemi kullandım.

https://stackoverflow.com/questions/23067475/how-do-i-obtain-pseudo-r2-measures-in-stata-when-using-glm-regression

Ayrıca, araştırma kapılarında mevcut olan sözde R2 hakkında harika bir makale var ... işte bağlantı:

https://www.researchgate.net/publication/222802021_Pseudo_R-squared_measures_for_Poisson_regression_models_with_over-_or_underdispersion

Umarım bu yardım.


Sadece family = gaussian (link = identity) ile bir GLM modelini takın ve değerini kontrol edin 1-summary(GLM)$deviance/summary(GLM)$null.deviance; R2'nin normal bir OLS regresyonunun R2 değeriyle eşleştiğini göreceksiniz, bu yüzden yukarıdaki cevap doğru! Buradaki postalara da bakabilirsiniz
Tom Wenseleers

3

R paketi, D-Squared'ü David J. Harris'in belirttiği gibi modEvAhesaplar.1 - (mod$deviance/mod$null.deviance)

set.seed(1)
data <- data.frame(y=rpois(n=10, lambda=exp(1 + 0.2 * x)), x=runif(n=10, min=0, max=1.5))

mod <- glm(y~x,data,family = poisson)

1- (mod$deviance/mod$null.deviance)
[1] 0.01133757
library(modEvA);modEvA::Dsquared(mod)
[1] 0.01133757

D-Squared ya da açıklanan Model Sapması (Guisan & Zimmermann 2000) https://doi.org/10.1016/S0304-3800(00)00354-9

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.