Bir veri kümesinde değerlerimin 99. yüzdelik dilimini kullanarak bir regresyon modeli yapmak için quantreg paketini kullanıyorum. Daha önce sorduğum bir stackoverflow sorusunun tavsiyelerine dayanarak , aşağıdaki kod yapısını kullandım.
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
ki verilerimin üstünde çizim yaptım. Ben puan için bir alfa değeri ile ggplot2 kullanarak bu çizdi. Bence dağılımımın kuyruğu analizimde yeterince dikkate alınmıyor. Belki de bu, yüzdelik tipi ölçümü tarafından göz ardı edilen bireysel noktaların varlığından kaynaklanmaktadır.
Yorumlardan biri,
Paket vinyet, doğrusal olmayan kantil regresyon ve ayrıca düzeltme çizgileri olan modeller vb.
Önceki soruma dayanarak logaritmik bir ilişki varsaydım, ancak bunun doğru olup olmadığından emin değilim. Tüm noktaları 99. yüzdelik aralıkta çıkarabildiğimi ve sonra ayrı ayrı inceleyebileceğimi düşündüm, ancak bunu nasıl yapacağımdan emin değilim, yoksa bu iyi bir yaklaşım. Bu ilişkiyi tanımlamanın nasıl geliştirileceğine dair herhangi bir tavsiyeyi takdir ediyorum.