Şu anda veri mühendisliği alanında yüksek lisans eğitimi almak isteyen işletme ve ekonomi mezunuyum. Doğrusal regresyon (LR) ve sonra zaman serisi analizi (TS) üzerinde çalışırken aklıma bir soru geldi. Neden çoklu lineer regresyon kullanmak ve ona gecikmeli değişkenler eklemek yerine yepyeni bir yöntem, yani zaman serisi (ARIMA) yaratalım (gecikmeler sırası ACF ve PACF kullanılarak belirlenir)? Böylece öğretmen konu hakkında biraz deneme yazmamı önerdi. Boş elini yardım etmeye gelmezdim, bu yüzden konuyla ilgili araştırmamı yaptım.
LR kullanırken, Gauss-Markov varsayımlarının ihlal edilmesi durumunda OLS regresyonunun yanlış olduğunu ve bunun zaman serisi verilerini (otokorelasyon vb.) Kullanırken olduğunu biliyordum. (bununla ilgili başka bir soru, bir GM varsayımının bağımsız değişkenlerin normal olarak dağıtılması mı yoksa sadece bağımsız değişkenlere koşullu bağımlı değişken mi?)
Ayrıca, burada önerdiğimi düşündüğüm dağıtılmış bir gecikme regresyonu kullanırken ve parametreleri tahmin etmek için OLS kullanarak değişkenler arasındaki çoklu bağlantıların ortaya çıkabileceğini (açıkçası) tahmin ederim.
Bir de TS ve LR hakkında benzer yazı burada, @IrishStat söyledi:
... regresyon modeli, dinamik regresyon modeli veya XARMAX modeli olarak da bilinen bir Transfer Fonksiyonu Modelinin özel bir halidir. Göze çarpan nokta, zaman serilerindeki model tanımlamasının, yani uygun farkların, X'lerin uygun gecikmelerinin, uygun ARIMA yapısının, Bakliyat, seviye Kaymaları, Yerel zaman eğilimleri, Mevsimsel Bakliyat ve birleşim gibi tanımlanmamış deterministik yapının uygun tanımlanmasıdır. parametrelerdeki değişiklikler veya hata sapmaları dikkate alınmalıdır.
(Autobox'ta Box Jenkins'e karşı LR hakkındaki makalesini de okudum.) Ama bu hala sorumu çözmüyor (ya da en azından benim için RL ve TS'nin farklı mekaniğini netleştirmiyor).
Gecikmeli değişkenlerde bile OLS problemlerinin ortaya çıktığı ve bunun ne etkili ne de doğru olmadığı açıktır, ancak maksimum olasılık kullanılırken bu sorunlar devam ediyor mu? ARIMA'nın maksimum olasılıkla tahmin edildiğini okudum, bu yüzden gecikmeli LR OLS yerine ML ile tahmin edilirse, "doğru" katsayıları verir mi (sipariş MA'sı gibi gecikmeli hata terimlerini de içerdiğimizi varsayalım) q).
Kısacası, sorun OLS mu? ML uygulanarak sorun çözüldü mü?