Quantreg kullanarak eğri şeklini belirleme konusunda tavsiyeler


10

Bir veri kümesinde değerlerimin 99. yüzdelik dilimini kullanarak bir regresyon modeli yapmak için quantreg paketini kullanıyorum. Daha önce sorduğum bir stackoverflow sorusunun tavsiyelerine dayanarak , aşağıdaki kod yapısını kullandım.

mod <- rq(y ~ log(x), data=df, tau=.99)    
pDF <- data.frame(x = seq(1,10000, length=1000) ) 
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )

ki verilerimin üstünde çizim yaptım. Ben puan için bir alfa değeri ile ggplot2 kullanarak bu çizdi. Bence dağılımımın kuyruğu analizimde yeterince dikkate alınmıyor. Belki de bu, yüzdelik tipi ölçümü tarafından göz ardı edilen bireysel noktaların varlığından kaynaklanmaktadır.

Yorumlardan biri,

Paket vinyet, doğrusal olmayan kantil regresyon ve ayrıca düzeltme çizgileri olan modeller vb.

Önceki soruma dayanarak logaritmik bir ilişki varsaydım, ancak bunun doğru olup olmadığından emin değilim. Tüm noktaları 99. yüzdelik aralıkta çıkarabildiğimi ve sonra ayrı ayrı inceleyebileceğimi düşündüm, ancak bunu nasıl yapacağımdan emin değilim, yoksa bu iyi bir yaklaşım. Bu ilişkiyi tanımlamanın nasıl geliştirileceğine dair herhangi bir tavsiyeyi takdir ediyorum.

resim açıklamasını buraya girin


Sitede bunun gibi verileri dönüştürmekten bahseden birkaç iyi soru var, bkz. Stats.stackexchange.com/q/1444/1036 veya stats.stackexchange.com/q/298/1036
Andy W

Koşullu medyan eklemek için çizimi güncelleyebilir misiniz? Bu bana bir veri dönüştürme probleminden daha bir kantil geçiş problemi gibi görünüyor ...
user603

@ user603 Koşullu medyan ile ne demek istiyorsun? (Çevrimiçi arama yaptım ama nasıl hesaplayacağından emin değilim)
celenius

ru () işlevinde tau = 0,5.
user603

1
Hedefiniz özellikle koşullu 99. yüzdelik değeri tahmin etmekse, doğrusal olmayan kantil regresyon için oy verirdim (bir çeşit - R paketlerini iyi bilmiyorum), çünkü gerçek fonksiyonel formu bildiğiniz gibi görünmüyor . Yine de, önceki sorunuzdan asıl amacın ne olduğunu bana açık değildim, bu nedenle önceki sorunuzun yorumunu Spacedman 4'ten 17: 01'de tekrar ederdim
David M Kaplan

Yanıtlar:


1

Tüm modeller yanlış, ancak bazıları faydalı (George Box). Logrithmic bir şekli takılan eğrinize zorluyorsunuz ve dürüst olmak gerekirse o kadar da kötü görünmüyor. Kuyruktaki uyum zayıftır çünkü orada daha az nokta vardır; izin verdiğiniz iki parametre verilerin büyük kısmına uyacaktır. Başka bir deyişle, günlük ölçeğinde, bu kuyruk, kaldıraç sağlamak için verilerinizin büyük bir kısmından yeterince uzakta değildir. Regresyonun kantil doğası ile ilgisi yoktur; OLS ayrıca bu noktaları göz ardı eder (özellikle log ölçeğinde).

Biraz daha doğrusal olmamaya izin vermek oldukça kolaydır. Ben doğal spline kısmi, ama yine, tüm modeller yanlış:

library(splines)
mod <- rq(y ~ ns(log(x), df=6), data=df, tau=.99)

quantregBu sana endişe ise paket monoton spline'lara için bazı özel kanca vardır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.