Süreksizliklere izin veren LOESS


14
  • LOESS gibi süreksizliklerin zamanlamasının bilinmediği sıfır, bir veya daha fazla süreksizliğe izin veren bir modelleme tekniği var mı ?
  • Bir teknik varsa, R'de mevcut bir uygulama var mı?

1
bilinen x-değerlerinde veya bilinmeyen x-değerlerinde süreksizlik? (bilinen x yeterince kolaydır)
Glen_b-Monica'yı yeniden başlat

@glen Soruyu güncelledim: Süreksizliklerin zamanlamasının apriori bilinmediği durumlarla ilgileniyorum.
Jeromy Anglim

Bu tartışmalı / aptalca bir soru olabilir, ama "zamanlama" diyorsunuz: bu zaman serileriyle kullanım için mi? Aşağıdaki cevapların çoğunun bunu kabul ettiğine inanıyorum ("değişim noktası, vb"). Bence.
Wayne

Yanıtlar:


15

Birden çok değişiklik noktası algılaması ve ardından her bir segmentte bağımsız düzeltme yapmak istediğiniz gibi geliyor. (Algılama çevrimiçi olabilir veya olmayabilir, ancak başvurunuzun çevrimiçi olması muhtemel değildir.) Bununla ilgili çok fazla literatür var; İnternet aramaları verimli.

  • DA Stephens 1994 yılında Bayes değişim noktası tespiti için faydalı bir giriş yazmıştır (Ek. Stat. 43 # 1 s. 159-178: JSTOR ).
  • Daha yakın zamanlarda Paul Fearnhead iyi çalışmalar yapıyor (örneğin, çoklu değişim noktası problemleri için kesin ve etkili Bayesci çıkarım , Stat Comput (2006) 16: 203-213: Ücretsiz PDF ).
  • D Barry ve JA Hartigan'ın güzel bir analizine dayanan özyinelemeli bir algoritma var
    • Değişim Noktası Modelleri için Ürün Bölme Modelleri, Ann. Stat. 20: 260-279: JSTOR ;
    • Değişim Noktası Problemleri için Bayes Analizi, JASA 88: 309-319: JSTOR .
  • Barry & Hartigan algoritmasının bir uygulaması O. Seidou & TBMJ Ourda, Çok Değişkenli Doğrusal Regresyonda Özyineleme Tabanlı Çoklu Değişim Tespiti ve Nehir Akımlarına Uygulama, Su Res. Res., 2006: Ücretsiz PDF .

Herhangi bir R uygulaması için çok fazla bakmadım (bir süre önce Mathematica'da kod yazmıştım), ancak bir tane bulursanız referansı takdir ediyorum.


3
Barry & Hartigan algoritmasını uygulayan bcp R paketini buldum jstatsoft.org/v23/i03/paper
Jeromy Anglim

@Jeromy: R paketi ve referanslara bağlantılar eklediğiniz için teşekkür ederiz.
whuber

7

koencker'ın kırık çizgi regresyonu ile yapın, bu vinyetin 18. sayfasına bakın

http://cran.r-project.org/web/packages/quantreg/vignettes/rq.pdf

Whuber kullanıcısının son yorumuna yanıt olarak:

Bu tahminci bu şekilde tanımlanır.

x ( i )x ( i - 1 )xR , ,x(i)x(i1)i

ei:=yiβix(i)β0 ,

z+=max(z,0) , ,z=max(z,0)

τ(0,1) ,λ0

min.βRn|τ,λi=1nτei++i=1n(1τ)ei+λi=2n|βiβi1|

τ = 0.9 λ λτ istenen kantili değeri verir (yani örnekte ). kesme noktası sayısını yönlendirir: large için bu tahminci hiçbir kesme noktasına çekilmez (classicla doğrusal kantil regresyon tahmin edicisine karşılık gelir).τ=0.9λλ

Quantile Smoothline Spline Roger Koenker, Pin Ng, Stephen Portnoy Biometrika, Cilt. 81, No. 4 (Aralık 1994), sayfa 673-680

Not: aynı kişiler tarafından aynı ada sahip açık bir çalışma kağıdı var ama aynı şey değil.


Bu güzel bir fikir: referans için teşekkürler. Bununla birlikte, bu uyumun kalıntıları oldukça kötü görünüyor, bu da potansiyel değişim noktalarını ne kadar iyi tanımladığını merak ediyor.
whuber

whuber: Kuantil regresyon teorisine ne kadar aşina olduğunuzu bilmiyorum. Bu hatların eğri çizgilere göre büyük bir avantajı vardır: herhangi bir hata dağılımı varsaymazlar (yani artıkların Gaussian olduğunu varsaymazlar).
user603

@kwak Bu ilginç görünüyor. Normal bir hata dağıtımının varsayılmaması, uygulamalarımdan biri için yararlı olacaktır.
Jeromy Anglim

Gerçekten de, bu tahminden elde ettiğiniz şey gerçek koşulsal niceliklerdir: Özetle, bunlar çiftlere kutu kutularının ne olduğu spline / LOESS regresyonlarıdır (ortalama, sd): verileriniz daha zengin bir görünümdür. Ayrıca gauss dışı bağlamda (asimetrik hatalar, ... gibi) geçerliliğini korurlar.
user603

@kwak: Kalanlar x-koordinatı ile büyük ölçüde ilişkilidir. Örneğin, negatif veya küçük pozitif artıkların uzun vadeleri vardır. Bir Gauss dağılımına sahip olup olmadıkları önemli değildir (herhangi bir keşif analizinde ilgisiz olduğu kadar): bu korelasyon uyumun zayıf olduğunu gösterir.
whuber

6

Bu sorunu çözmek için bazı yöntemler ve ilişkili R paketleri

Regresyondaki dalgacık önişleme tahmini süreksizliklere izin verir. Wavethresh paketini R dilinde kullanabilirsiniz.

Bir çok ağaç bazlı yöntemlerle Eğer disconitnuities varken (uzak olmayan Dalgacığın fikrinden) yararlıdır. Bu yüzden paket treethresh, paket ağaç!

" Yerel maksimum olabilirlik " yöntemlerinin bir arada ... diğerleri arasında: Pozhel ve Spokoiny'nin çalışması: Uyarlanabilir ağırlıklar Yumuşatma (paket aws) Catherine Loader'ın çalışması: paket locfit

Herhangi bir çekirdek yerel olarak değişen bant genişliği ile daha pürüzsüz tahmin yapar ama bunun için R paketi bilmiyorum.

not: Gerçekten LOESS ve regresyon arasındaki farkın ne olduğunu anlamıyorum ... LOESS algoritmalarında “çevrimiçi” olması gerektiği fikri mi?


1
Re LOESS: Belki de benim terminolojim pek doğru değil. LOESS ile, yerelleştirilmiş eğri uydurma biçimini kullanarak X'ten Y'yi tahmin eden modellere atıfta bulunuyorum. örneğin, bu grafiklerin çoğunda görüldüğü gibi: google.com/…
Jeromy Anglim

2

Doğrusal olmayan regresyon fonksiyonu nls, b spline'ları (örneğin spline paketindeki bs fonksiyonu) ve ifelse fonksiyonunu kullanarak R'deki bir çözümü kodlamak mümkün olmalıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.