Zaman serisi modellerinde R kare kullanımıyla ilgili sorun nedir?


12

Zaman serisi için R-kare kullanmanın uygun olmadığını okudum çünkü bir zaman serisi bağlamında (başka bağlamlar olduğunu biliyorum) R-kare artık benzersiz değil. Bu neden? Bunu aramaya çalıştım ama hiçbir şey bulamadım. Modellerimi değerlendirdiğimde tipik olarak R-kare (veya Düzeltilmiş R-Kare) 'ye fazla değer vermem, ancak bir çok meslektaşım (yani Business Majors) kesinlikle R-Squared'e aşık ve bunu yapabilmek istiyorum R-Squared'in neden zaman serileri bağlamında uygun olmadığını açıklayın.


3
Google arama: "ekonometride sahte regresyon". Ya da Granger ve Newbold'un makalesine göz atın . Diğerleri cevaplarda daha fazla ayrıntı verebilir.
Graeme Walsh

@Richard Hardy, "Numune R2'yi popülasyon muadilinin bir ölçüsü olarak alırsak, entegre zaman serileri altında parçalanır."
Siddharth Krishnamurthy

Yanıtlar:


18

Sorunun bazı yönleri:

Birileri bize numaralarının vektör verirse ve rakamlardan oluşan bir uyumlu matris , biz tedavi, bazı tahmin cebir yürütmek için aralarındaki ilişki ne olduğunu bilmek gerekmez bağımlı değişken olarak. Cebir, bu sayıların kesit veya zaman serilerini veya panel verilerini temsil edip etmediğine veya matrisinin vb. Gecikmeli değerleri içerip içermediğine bakılmaksızın sonuçlanır . yXyXy

Belirleme katsayısının temel tanımı olduğuR2

R2=1SSresSStot

burada , bazı tahmin prosedüründen kare kalıntıların toplamıdır ve , bağımlı değişkenin örnek ortalamasından kare sapmalarının toplamıdır.SSresSStot

Birleştirildiğinde, her zaman benzersiz bir şekilde hesaplanır, belirli bir veri örneği için, değişkenler arasındaki ilişkinin spesifik bir formülasyonu ve belirli bir tahmin prosedürü, yalnızca tahmin prosedürünün nokta tahminleri sağlayacak şekilde olması şartıyla bilinmeyen miktarların (ve dolayısıyla bağımlı değişkenin nokta tahminlerinin ve dolayısıyla artıkların nokta tahminlerinin) Bu üç özellikten herhangi biri değişirse, aritmetik değeri genel olarak değişecektir -ama bu sadece zaman serileri için değil, her türlü veri için geçerlidir.R2R2

Dolayısıyla, ve zaman serileri ile ilgili sorun , "benzersiz" olup olmadığı değildir (zaman serisi verileri için çoğu tahmin prosedürü nokta tahminleri sağladığından) değildir. Sorun "olağan" zaman serisi spesifikasyon çerçevesinin için teknik olarak kolay olup olmadığı ve bazı yararlı bilgiler sağlayıp sağlamadığıdır . R2R2R2

"açıklanan değişken değişken varyans oranı" olarak yorumlanması, kritik olarak sıfıra eklenen kalıntılara bağlıdır. Doğrusal regresyon (ne tür verilerde olursa olsun) ve Sıradan En Küçük Kareler kestirimi bağlamında, bu sadece şartname regresör matrisinde sabit bir terim (zaman serisi terminolojisinde bir "sürüklenme" içeriyorsa) garanti edilir. Otoregresif zaman serisi modellerinde, bir sapma çoğu durumda dahil edilmemiştir. R2

Daha genel olarak, zaman serisi verileriyle karşı karşıya kaldığımızda, “otomatik” olarak zaman serilerinin geleceğe nasıl evrimleşeceğini düşünmeye başlarız. Bu nedenle, zaman serisi modelini , gelecekteki değerleri ne kadar iyi tahmin ettiğini, geçmiş değerlere ne kadar iyi uyduğunu temel alarak değerlendirme eğilimindeyiz . Ancak esas olarak ikincisini değil, ikincisini yansıtır. regresör sayısında azalmadığı bilinen gerçek, regresörleri ( herhangi bir regresörü, yani herhangi bir sayı dizisini, belki de kavramsal olarak bağımlı değişkenle tamamen ilgisiz) ekleyerek mükemmel bir uyum sağlayabileceğimiz anlamına gelir. . Deneyimler, bu şekilde elde edilen mükemmel uyumun aynı zamanda uçurum da vereceğini göstermektedir.R2R2 numunenin dışındaki tahminler.

Sezgisel olarak, bu belki de karşı-sezgisel değiş tokuş gerçekleşir çünkü bağımlı değişkenin tüm değişkenliğini tahmini bir denkleme yakalayarak sistematik değişkenliği tahmin açısından (burada, "sistematik olmayan" bilgimize göre anlaşılmalıdır. - tamamen deterministik bir felsefi bakış açısından, "sistematik olmayan değişkenlik" diye bir şey yoktur, fakat sınırlı bilgimiz bizi değişkenliğe "sistematik olmayan" gibi davranmaya zorlayana kadar, onu yine de sistematik hale getirme çabası bileşen, tahmin felaket getirir).

Aslında bu belki birisine zaman serisiyle uğraşırken neden ana teşhis / değerlendirme aracı olmaması gerektiğini göstermenin en ikna edici yoludur : regresör sayısını olan bir noktaya kadar artırın . Sonra tahmini denklemi alın ve bağımlı değişkenin gelecekteki değerlerini tahmin etmeye çalışın.R2R21


İyi açıklama ama sonra bu neden istatistiksel pakette yazılımın standart bir çıktı olarak eklendi

@brijesh Regresyon geleneği diyebilirim.
Alecos Papadopoulos

Mükemmel cevap! Ancak, zaman serilerine özgü çok az bilgi içerir. Tahmin ve örnek içi uyum karşılaştırması, muhtemelen zaman serileri kadar diğer veri türleri için de geçerlidir. Öte yandan, zaman serilerine özgü bir önemli unsur eksiktir. Yani entegre değişkenlerin gerilemesi. Örnek popülasyon karşılığının bir ölçüsü olarak alırsak , entegre zaman serileri altında parçalanır. (Bunu bir cevap olarak yazabilirdim ama şu anda vaktim yok.)R2
Richard Hardy
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.