Otokorelasyon ile anlaşma nedir?


13

Önceden, oldukça derin bir matematik geçmişim var, ama asla zaman serileri veya istatistiksel modelleme ile hiç ilgilenmedim. Bu yüzden bana karşı çok nazik olmak zorunda değilsin :)

Ticari binalarda enerji kullanımının modellenmesi hakkındaki bu makaleyi okuyorum ve yazar bu iddiayı öne sürüyor:

[Otokorelasyon varlığı] ortaya çıkar çünkü model doğal olarak otokorelasyona bağlı enerji kullanımının zaman serisi verilerinden geliştirilmiştir. Zaman serisi verileri için herhangi bir tamamen deterministik modelde otokorelasyon olacaktır. Otokorelasyonun modele [daha fazla Fourier katsayısı] dahil edilirse azaldığı bulunmuştur. Bununla birlikte, çoğu durumda Fourier modeli düşük CV'ye sahiptir Bu nedenle model, yüksek hassasiyet gerektirmeyen (sic) pratik amaçlar için kabul edilebilir olabilir.

0.) "Zaman serisi verileri için tamamen deterministik bir modelin otokorelasyonu olacaktır" ne demektir? Bunun ne anlama geldiğini belirsiz bir şekilde anlayabiliyorum - örneğin, 0 otokorelasyonunuz varsa zaman dizinizdeki bir sonraki noktayı nasıl tahmin edersiniz? Bu matematiksel bir argüman değil, elbette, bu yüzden bu 0 :)

1.) Otokorelasyonun temel olarak modelinizi öldürdüğü izlenimindeydim, ama bunu düşünerek, bunun neden böyle olması gerektiğini anlayamıyorum. Peki otokorelasyon neden kötü (veya iyi) bir şey?

2.) Otokorelasyonla ilgili duyduğum çözüm, zaman serilerini ayırmaktır. Yazarın aklını okumaya çalışmadan, ihmal edilemez otokorelasyon mevcutsa neden fark edilmez ?

3.) İhmal edilemez otokorelasyonlar bir model üzerinde hangi sınırlamaları getirir? Bu bir yerde bir varsayım mı (yani basit doğrusal regresyon ile modelleme yaparken normalde dağılmış artıklar)?

Her neyse, bunlar temel sorularsa özür dilerim ve yardım için şimdiden teşekkürler.

Yanıtlar:


10
  1. Yazarın muhtemelen modelin kalıntıları hakkında konuştuğunu düşünüyorum . Bunu daha fazla fourier katsayısı ekleme konusundaki ifadesi nedeniyle savunuyorum; inandığım gibi, daha Fourier bir model takıyorsa, daha fazla katsayı eklemek, daha yüksek bir CV pahasına kalanların otokorelasyonunu azaltacaktır.

    Bunu görselleştirmekte sorun yaşıyorsanız, aşağıdaki örneği düşünün: eklenen beyaz gauss gürültüsü olan iki katsayılı fourier modelinden gelen aşağıdaki 100 nokta veri kümesine sahip olduğunuzu varsayalım:

    Veri noktaları

    Aşağıdaki grafik iki uyumu gösterir: biri 2 fourier katsayısı ile yapılır, diğeri 200 fourier katsayısı ile yapılır:

    Uyumlar

    Gördüğünüz gibi, 200 fourier katsayısı DATAPOINTS'e daha iyi uyurken, 2 katsayı ('gerçek' model) MODEL'e daha iyi uyuyor. Bu, 200 katsayılı model kalıntılarının otokorelasyonunun, 2 katsayılı modelin kalıntılarından tüm gecikmelerde neredeyse kesinlikle sıfıra daha yakın olacağı anlamına gelir, çünkü 200 katsayılı model tam olarak tüm veri noktalarına sığar (yani artıklar, neredeyse sıfırlar). Bununla birlikte, örneğin 10 veri noktasını numuneden çıkarır ve aynı modellere uyarsanız ne olacağını düşünürdünüz? 2 katsayılı model, numuneden çıkardığınız veri noktalarını daha iyi tahmin edecektir! Böylece, 200 katsayılı modele göre daha düşük bir CV hatası üretecektir; buna aşırı takma denir. Bu 'büyünün' arkasındaki neden, CV'nin gerçekte ölçmeye çalıştığı şey tahmin hatası , yani modelinizin veri kümenizde olmayan veri noktalarını ne kadar iyi tahmin ettiği.

  2. Bu bağlamda, artıklar üzerindeki otokorelasyon 'kötü' çünkü veri noktaları arasındaki korelasyonu yeterince iyi modellemediğiniz anlamına gelir. İnsanların seriyi fark etmemelerinin temel nedeni , temeldeki süreci olduğu gibi modellemek istedikleri içindir . Biri genellikle periyodikliklerden veya eğilimlerden kurtulmak için zaman serilerini farklılaştırır, ancak bu periyodiklik veya eğilim aslında modellemeye çalıştığınız şeyse, o zaman onları ayırmak son çare seçeneği (veya kalıntıları modellemek için bir seçenek gibi görünebilir) daha karmaşık bir stokastik süreç).
  3. Bu gerçekten üzerinde çalıştığınız alana bağlıdır. Deterministik modelde de bir sorun olabilir. Bununla birlikte, otokorelasyonun şekline bağlı olarak, otokorelasyon, örneğin titreşim gürültüsü, ARMA benzeri gürültü nedeniyle ortaya çıktığında veya bunun altında yatan bir periyodik kaynak olması durumunda kolayca görülebilir (bu durumda artırmak isteyebilirsiniz fourier katsayılarının sayısı).

Yanıtınız için teşekkür ederiz, eğer istekliyseniz, bunları birer birer sindirmeyi denemek istiyorum. 1) için, neden daha fazla Fourier katsayısı eklemenin otokorelasyonu azalttığını ve CV'yi artırdığını anlamak için sezgisel bir yol var mı (bunun kalıntıların CV'si olduğunu varsayıyorum)?
BenDundee

1
Bir örnek ekledim. Umarım yardımcı olur. Ve evet, artıkların CV'sine atıfta bulunuyor.
Néstor

Ahh tamam, sanırım görüyorum. Bu, 2 ile ilgili olarak soracağım şeye bağlanır. Korelasyonu daha iyi anlamak için bu modeli (genel olarak) yamalamaya ne dersiniz? Fourier katsayılarının korelasyon matrisi hakkında bir kısıtlama ekleyebilir misiniz?
BenDundee

1
Bu benim de zor olduğum bir iş. Özellikle periyodik deterministik modellerde ne tür bir gürültü modelinin kullanılacağını bilmek gerçekten zorlaşıyor. Büyük sorun, a-priori'yi fourier modelinin katsayı sayısını bilmemenizdir, bu yüzden onlar da modellemeniz gereken rastgele değişkenlerdir. Düşük sayıda veri noktasının varlığında, bunu modellemek için kesinlikle geri dönüşümlü bir atlama MCMC'ye giderim. Farklı gürültü modellerini dener ve aralarındaki AIC / BIC'yi karşılaştırırdım. Ancak büyük veri kümeleri için bu mümkün değildir.
Néstor

3

Bu makalede, ' Ekonometride Sahte Regresyonlar ', trendleri ortadan kaldırmanın neden gerekli olduğu konusunda kafamı bulmaya çalışırken yararlı buldum. Esasen iki değişken eğilim gösteriyorsa, bunlar değişecektir, bu da sorun için bir reçetedir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.