Greg'in önerisinin denemesi gereken ilk şey: Poisson regresyonu birçok betonda doğal modeldir durumlar.
Ancak önerdiğiniz model örneğin yuvarlatılmış verileri gözlemlediğinizde ortaya çıkabilir:
iid normal hatalarla .
Yben= ⌊ axben+ b +εben⌋ ,
ϵi
Bence, bununla neler yapılabileceğine bir göz atmak ilginç. Standart normal değişkenin cdf'sini gösteririm . Eğer , daha sonra
, bilindik bilgisayar gösterimlerini kullanarak.Fϵ∼N(0,σ2)
P(⌊ax+b+ϵ⌋=k)=F(k−b+1−axσ)−F(k−b−axσ)=pnorm(k+1−ax−b,sd=σ)−pnorm(k−ax−b,sd=σ),
Veri noktalarını gözlemliyorsunuz . Günlük olasılığı
Bu, en küçük karelerle aynı değildir. Bunu sayısal bir yöntemle en üst düzeye çıkarmayı deneyebilirsiniz. İşte R'de bir örnek:(xi,yi)
ℓ(a,b,σ)=∑ilog(F(yi−b+1−axiσ)−F(yi−b−axiσ)).
log_lik <- function(a,b,s,x,y)
sum(log(pnorm(y+1-a*x-b, sd=s) - pnorm(y-a*x-b, sd=s)));
x <- 0:20
y <- floor(x+3+rnorm(length(x), sd=3))
plot(x,y, pch=19)
optim(c(1,1,1), function(p) -log_lik(p[1], p[2], p[3], x, y)) -> r
abline(r$par[2], r$par[1], lty=2, col="red")
t <- seq(0,20,by=0.01)
lines(t, floor( r$par[1]*t+r$par[2]), col="green")
lm(y~x) -> r1
abline(r1, lty=2, col="blue");
Kırmızı ve mavi renkte, bu olasılığın sayısal olarak maksimize edilmesiyle çizgileri ve en küçük kareler bulunur. Yeşil merdiven, maksimum olasılıktan için ... bu, 0,5'e kadar bir çeviriye kadar en küçük kareleri kullanabileceğinizi ve kabaca aynı sonucu elde edebileceğinizi gösterir; veya en küçük kareler modeline çok
burada en yakın tam sayıdır. Yuvarlanmış veriler o kadar sık karşılanır ki, bunun bilindiğinden ve kapsamlı bir şekilde çalışıldığından eminim ...ax+b⌊ax+b⌋a,bb
Yi=[axi+b+ϵi],
[x]=⌊x+0.5⌋