Doğrusal regresyon modeline periyodik bileşen nasıl eklenir?


17

Bazı toplu frekans verilerim var. Bir satırı , verilere son derece iyi uyuyor gibi görünür, ancak satırda döngüsel / periyodik kıpırdatma vardır. Kümülatif frekansın ne zaman belirli bir değere ulaşacağını tahmin etmek istiyorum c . Artıkları ve takılmış değerleri karşılaştırdığımda güzel bir sinüzoidal davranış elde ederim.y=ax+bc

Şimdi, başka bir komplikasyon eklemek için, artıklarda

alternatif metin

diğerlerinden daha düşük değerlere sahip iki döngü vardır, bu da dikkate alınması gereken bir hafta sonu etkisini temsil eder.

Peki, buradan nereye gideceğim? Bazı kosinüs, sinüs veya döngüsel terimi yaklaşık olarak regresyon modelinde nasıl birleştirebilirim? kümülatif frekansın ne zaman eşit olacağını tahmin edin ?c

Yanıtlar:


9

Harika stl()yöntemi deneyebilirsiniz - (yinelenen loess()fitting kullanarak ) trend ve mevsimsel ve kalanlara ayrışır . Bu sadece burada salınımlarınızı alabilir.


8

Salınımın frekansını biliyorsanız, sin (2π wt) ve cos (2πwt) - istenen dalga boyunu elde etmek için w olarak ayarlanan - iki ek öngörücü ekleyebilirsiniz ve bu salınımı modelleyecektir. Genlik ve faz açısına uyması için her iki terime de ihtiyacınız vardır. Birden fazla frekans varsa, her frekans için sinüs ve kosinüs terimine ihtiyacınız olacaktır.

Frekansların ne olduğunu bilmiyorsanız, birden fazla frekansı izole etmenin standart yolu, verileri aldatmak (kalıntıları lineer uyumdan elde ettiğiniz gibi almak) ve artıklara karşı ayrı bir Fourier dönüşümü çalıştırmaktır. Bunu yapmanın hızlı ve kirli bir yolu, Veri Analizi Eklentisi'nde Fourier Analizi aracı olan MS-Excel'de. Kalıntılara karşı analizi çalıştırın, dönüşümlerin mutlak değerini alın ve sonucu çubuk grafikle çizin. Zirveler, modellemek istediğiniz ana frekans bileşenleriniz olacaktır.

Bu döngüsel yordayıcıları eklediğinizde, regresyonunuzdaki p-değerlerine çok dikkat edin ve fazla takmayın. Yalnızca istatistiksel olarak anlamlı frekansları kullanın. Ne yazık ki, bu düşük frekansların takılmasını biraz zorlaştırabilir.


2
Verilerdeki frekansları tahmin ettiğinizde (Fourier analizinde olduğu gibi) ve sonra bunları regresyona sin / cos terimleri olarak dahil ettiğinizde, p değerleri anlamsız olacaktır.
whuber

4

Bu verilere uyan sıradan en küçük karelerin muhtemelen uygun olmadığını gözlemleyerek başlayalım. Biriken verilerin her zamanki gibi rastgele hata bileşenlerine sahip olduğu varsayılırsa, kümülatif verilerdeki hata ( alacağınız kümülatif frekanslar var olandan -Öyle en farklı bir şey) tüm hata terimlerinin kümülatif toplamıdır. Bu, kümülatif verileri heteroscedastik hale getirir (zaman içinde gittikçe daha değişken hale gelir) ve güçlü bir şekilde pozitif korelasyon gösterir. Bu veriler çok düzenli davrandığından ve çok fazla olduğu için, uyum konusunda çok az sorun vardeğil , hata tahminleriniz, tahminleriniz (sorunun tamamı budur) hakkında), ve özellikle standart tahmin hatalarınız yoldan çıkabilir.

Bu tür verileri analiz etmek için standart bir prosedür orijinal değerlerle başlar. Yüksek frekanslı sinüzoidal bileşeni çıkarmak için günlük farklılıkları alın. Olası bir haftadan haftaya döngüsünü kaldırmak için bunların haftalık farklılıklarını alın. Geriye kalanları analiz edin. ARIMA modelleme güçlü ve esnek bir yaklaşımdır, ancak basitçe başlayın: Neler olup bittiğini görmek için bu farklı verileri grafiğe alın, sonra oradan devam edin. Ayrıca, iki haftadan daha kısa verilerle haftalık döngü tahminlerinizin zayıf olacağını ve bu belirsizliğin tahminlerdeki belirsizliğe hakim olacağını unutmayın.


2

Açıkça baskın salınım bir gün var. Görünüşe göre haftanın günü ile ilgili daha düşük frekanslı bileşenler de var, bu yüzden bir hafta (yani günün yedide biri) ve ilk birkaç harmoniği olan bir bileşen ekleyin. Bu formun bir modelini verir:

E(y)=c+bir0marul(2πt)+b0günah(2πt)+bir1marul(2πt/7)+b1günah(2πt/7)+bir2marul(4πt/7)+b2günah(4πt/7)+...

- varsayalım tgün cinsinden ölçülür. Burayayolan ham verileri, kümülatif miktar.


-2

Neden sadece bir Sine (veya kosinüs) serisinin genliğini, periyodunu ve fazını sırayla bulmak için bir GA kullanmıyorsunuz, sonra birleştiriyorsunuz. Aşağıdakileri optimize edin: (n (n-1) / ((np-1) ^ 2 (np-2))) RSS


1
Bunun ters kümülatif frekans fonksiyonunun hesaplanmasıyla ilgili soruyu nasıl cevapladığı belirsizdir. Peki "GA" ile ne demek istiyorsun? Genetik Algoritma? Başka bir şey?
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.