Kuantil regresyonda R-kare


21

Verilerimin yüzde 90’ının tahmin edicilerini bulmak için nicel regresyon kullanıyorum. Bunu quantregpaket kullanarak R'de yapıyorum . Nasıl belirleyebilir tahmini değişkenleri ile açıklanabilir ediliyor nasıl değişkenlik kadar gösterecektir kuantil regresyon için?r2

Gerçekten bilmek istediğim: "Değişkenliğin ne kadarının açıklandığını bulmak için kullanabileceğim herhangi bir yöntem var mı?". P değerlerine göre anlamlılık düzeyleri komutunun çıktısında mevcuttur: summary(rq(formula,tau,data)). Uyum iyiliğini nasıl alabilirim?


7
R2 , kuantil regresyon ile ilgili değildir.
whuber

@whuber: Değişkenliğin ne kadarının açıklandığını bulmak için kullanabileceğim alternatif bir yöntem var mı?
rnso,

2
Bu, bir yorumun içine gömülmek yerine, sorunuzun gövdesinde sormanız gereken iyi bir şey olacaktır! “Açıklanan değişkenlik” (farklılıklar açısından ölçüldüğü şekilde), esasen en küçük kareler kavramıdır; belki de istediğin uygun bir istatistiksel anlamlılık ölçüsü veya uygunluk iyiliğidir.
whuber

Herhangi bir değer için neyin iyi performans olacağını, neyin düşük performans olacağını ve neyin alakasız olacağını düşünmeniz gerekir. Mesela, bu, yüzde 10'un berbat bir yordayıcısı ise, yüzde 90'ın eleştirisi değildir. Eğer kuantil regresyon kullanmıyorsanız kriteriniz kullanacağınız her şey olabilir. Tahmininiz sürekli ise, tanımlaması zor olabilir.
Nick Cox,

1
@whuber: Ben bunu soruna ekledim. P değerine göre önem seviyesi, özet (rq (formula, tau, data)) çıktısında bulunur. Nasıl formda iyilik elde edebilirim?
rnso,

Yanıtlar:


23

Koenker ve Machado , belirli ( ) kuantildeki yerel bir uygunluk ölçüsü olan tanımlar . R 1 τ[1]R1τ

LetV(τ)=minbρτ(yixib)

Let ve \ yaklaşık işareti {\ p} (\ tau) tam modeli ve sınırlı bir model için katsayı kestirimleri olabilir ve izin \ şapka {V} ve \ yaklaşık işareti {V} olmak karşılık gelen V terimleri. ~ β (τ) V ~ V Vβ^(τ)β~(τ)V^V~V

Uygunluk kriterinin iyiliğini tanımlarlar R,1(τ)=1-V^V~ .

Koenker için kodu verir V burada ,

rho <- function(u,tau=.5)u*(tau - (u < 0))
V <- sum(rho(f$resid, f$tau))

Bu yüzden, sadece kesen bir model için ( - veya aşağıdaki kod parçasında) ve sonra da sınırlandırılmamış bir modelde ( ) hesaplarsak, bunu en azından değil - her zamanki gibi .~ V V R 2VV~V0V^R1 <- 1-Vhat/V0R,2

Düzenleme: Sizin durumunuzda, elbette, ikinci f$taukod sırasındaki çağrıda nereye yerleştirilecek ikinci argüman, hangi değeri kullanırsanız kullanacaktır tau. İlk satırdaki değer yalnızca varsayılanı ayarlar.

'Ortalamaya ilişkin varyansı açıklamak' gerçekten kuantil regresyon ile yaptığınız şey değildir, bu yüzden gerçekten eşdeğer bir önlem almayı beklememelisiniz.

kavramının kuantil regresyona iyi dönüştüğünü sanmıyorum . Burada olduğu gibi, daha fazla veya daha az benzer miktarları tanımlayabilirsiniz, fakat ne seçerseniz seçin, gerçek OLS regresyonundaki özelliklerinin çoğuna sahip olamazsınız . Hangi özelliklere ihtiyaç duyduğunuz ve neye ihtiyacınız olmadığı konusunda net olmanız gerekir - bazı durumlarda istediğiniz şeyi yapan bir önlem almak mümkün olabilir.R 2R,2R,2

-

[1] Koenker, R ve Machado, J (1999),
Kuantil Regresyon için Uygunluk ve İlgili Çıkarım Süreçleri
, Amerikan İstatistik Kurumu Dergisi, 94 : 448, 1296-1310


Tau = 0.9, 0.5 yerine olmalı mı?
Dimitriy V. Masterov,

Evet, olmalı, ancak doğru ikinci argümanı verirseniz (yukarıda belirtilen ikinci satırda yapıldığı gibi), böyle çalışır. İlk satırdaki 0,5 değeri tau, işlevi çağırdığınızda belirtmezseniz basitçe varsayılan bir argümandır . Yayında netleşeceğim.
Glen_b

@Glen_b Açıklama için teşekkürler. Aptalca bir şey yapmıyorsam, V, takma bir yerine tahmini nicelikle ilgili ağırlıklı sapmaların toplamı gibi görünüyor . R,2
Dimitriy V. Masterov,

@Dititriy Uh, haklısın, ben bir şeyi dışarıda bıraktım. Bunu kısa sürede düzelteceğim.
Glen_b

@Dimitriy Sanırım şimdi düzelttim.
Glen_b

19

JASA'da Koenker ve Machado'nun (1999) önerdiği sözde ölçüsü , ilgilenilen model için ağırlıklı sapmaların toplamını, yalnızca kesişmenin göründüğü bir modelden aynı toplam ile karşılaştırarak, uygunluğun ölçülmesini sağlar. Olarak hesaplanırR,2

R,1(τ)=1-Σybeny^benτ|yben-y^ben|+Σyben<y^ben(1-τ)|yben-y^ben|Σybeny¯τ|yben-y¯|+Σyben<y¯ben(1-τ)|yben-y¯|,

takılmıştır inci miktarsal gözlem için ve kesişme-okunur donatılmış bir değerdir modeli.τi ˉ y =pτy^ben=ατ+βτxτbeny¯=βτ

[ 0 , 1 ] τ R' 2R,1(τ) arasında olmalıdır sapmalar ağırlıklı toplamından oluşur payı sıfır olur çünkü 1 mükemmel bir uyum karşılık gelir. Bu bir yerel Üzerinde QRM için uyum ölçüsünü bağlıdır çünkü küresel aksine OLS gelen. Muhtemelen, onu kullanma konusundaki uyarıların kaynağı budur: Eğer kuyruk modeline uyarsanız, başka hiçbir yere tam oturduğunu garanti edemezsiniz. Bu yaklaşım iç içe modelleri karşılaştırmak için de kullanılabilir.[0,1]τR,2

İşte R'de bir örnek:

library(quantreg)
data(engel)

fit0 <- rq(foodexp~1,tau=0.9,data=engel)
fit1 <- rq(foodexp~income,tau=0.9,data=engel)

rho <- function(u,tau=.5)u*(tau - (u < 0))
R1 <- 1 - fit1$rho/fit0$rho

Bu muhtemelen daha zarif bir şekilde başarılabilir.


Formülünüz iyi görünmüyor. Eksi oturumundan sonra: R_1(\tau) = 1 - 􀀀Son karakter bir tür karışıklıktır. Şunu kontrol eder misin? Belki de Tex kullanmak yerine standart olmayan bazı karakterleri yapıştırdınız
Tim

@Benim zaman tex veya ekranda garip bir şey görmüyorum.
Dimitriy V. Masterov,

Hem linux hem de pencerelerde şöyle görünür
Tim

@Tim Bu kutu hiçbir şeye karşılık gelmez, bu yüzden göz ardı edilebilir. Daha sonra başka bir makineden düzenlemeyi deneyeceğim.
Dimitriy V. Masterov,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.