Bir AR (1) ile rastgele bir yürüyüş tahmin ettiğimde, katsayı 1'e çok yakın ama her zaman daha az.
Katsayının birden fazla olmamasının matematik nedeni nedir?
Bir AR (1) ile rastgele bir yürüyüş tahmin ettiğimde, katsayı 1'e çok yakın ama her zaman daha az.
Katsayının birden fazla olmamasının matematik nedeni nedir?
Yanıtlar:
OLS tarafından x t = ρ x t - 1 + u t modelini tahmin ediyoruz ,
T boyutunda bir örnek için tahminci
Buna bazen "Dickey-Fuller" dağılımı denir, çünkü aynı ismin Birim Kök testlerini gerçekleştirmek için kullanılan kritik değerlerin temelidir.
Örnekleme dağılımının şekli için sezgi sağlama girişimi gördüğümü hatırlamıyorum . Rastgele değişkenin örnekleme dağılımına bakıyoruz
Bağımsız Ürün Normallerini toplarsak, sıfır etrafında simetrik kalan bir dağılım elde ederiz. Örneğin:
Ama bağımsız olmayan Ürün Normallerini bizim durumumuz gibi toplarsak
sağa eğik olan ancak negatif değerlere daha fazla olasılık kütlesi tahsis edilen. Numune boyutunu arttırırsak ve toplama daha fazla ilişkili öğeler eklersek, kütle sola daha fazla itilir gibi görünür.
Bağımsız olmayan Gammaların toplamının karşılıklılığı, pozitif çarpıklığa sahip negatif olmayan rastgele bir değişkendir.
Bu gerçekten bir cevap değil ama bir yorum için çok uzun, bu yüzden yine de bu yazı.
100 örnek boyutu ("R" kullanarak) için yüz üzerinden 1 iki kat daha büyük bir katsayı elde edebildi:
N=100 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~y[-T]) # regress y on its own first lag, with intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1
84. ve 95. gerçekleşmelerin katsayısı 1'in üzerinde olduğundan her zaman birinden düşük değildir . Bununla birlikte, eğilim aşağı yönlü bir tahminde bulunma eğilimindedir. Sorular devam ediyor, neden ?
Düzenleme: Yukarıdaki regresyonlar, modele ait görünmeyen bir kesme terimi içeriyordu. Kesişim kaldırıldıktan sonra, 1'den (10000'den 3158) çok daha fazla tahmin alıyorum - ancak yine de tüm vakaların% 50'sinin altında.
N=10000 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1