Akla gelen bir örnek, Gauss-Markov varsayımları karşılandığında gerekli olmamakla birlikte (istatistikçinin durumun bilemeyebileceği ve dolayısıyla hala GLS'yi uyguladığı) gözlemleri farklı şekilde ağırlıklandıran bazı GLS tahmincisidir.
Örnekleme için bir sabit üzerinde yi , i=1,…,n regresyonu durumunu düşünün (genel GLS tahmincilerini kolayca genelleştirir). Burada, {yi} nin ortalama μ ve varyans σ2 olan bir popülasyondan rastgele bir örnek olduğu varsayılmaktadır .
Sonra, EKK sadece olduğunu biliyoruz β = ˉ y , örnek ortalaması. Her bir gözlem ağırlık yüklü olduğunu vurgulamak için 1 / n , bu bilgileri
β = N Σ i = 1 1β^=y¯1/nβ^=∑i=1n1nyi.
Bu çok iyi bilinmektedirVar(β^)=σ2/n.
Şimdi, şu şekilde yazılabilir bir tahmin edici dikkate
β~=∑i=1nwiyi,
ağırlıkları, örneğin olduğu bu ∑iwi=1 . Bu, tahmin edicinin tarafsız olmasını sağlar, çünkü
E(∑i=1nwiyi)=∑i=1nwiE(yi)=∑i=1nwiμ=μ.
Tüm Laiiçinwi=1/n
olmadığı sürece(bu durumda elbetteOLS'ye düşecektir) varyansı, OLG'ninkini aşacaktır,örneğin bir Lagrangian aracılığıyla gösterilebilir:i
L=V(β~)−λ(∑iwi−1)=∑iw2iσ2−λ(∑iwi−1),
wi2σ2wi−λ=0i∂L/∂λ=0∑iwi−1=0λwi=wjwi=1/n
Aşağıda, aşağıdaki kodla oluşturulan küçük bir simülasyondan grafik bir örnek verilmiştir:
yiIn log(s) : NaNs produced
wi=(1±ϵ)/n
Son üçünün OLS çözeltisi tarafından daha iyi performans göstermesi, BLUE özelliği tarafından hemen ima edilmez (en azından bana değil), çünkü lineer tahmin ediciler olup olmadığı açık değildir (ne MLE ve Huber'in tarafsız olup olmadığını da bilmiyorum).
library(MASS)
n <- 100
reps <- 1e6
epsilon <- 0.5
w <- c(rep((1+epsilon)/n,n/2),rep((1-epsilon)/n,n/2))
ols <- weightedestimator <- lad <- mle.t4 <- huberest <- rep(NA,reps)
for (i in 1:reps)
{
y <- rnorm(n)
ols[i] <- mean(y)
weightedestimator[i] <- crossprod(w,y)
lad[i] <- median(y)
mle.t4[i] <- fitdistr(y, "t", df=4)$estimate[1]
huberest[i] <- huber(y)$mu
}
plot(density(ols), col="purple", lwd=3, main="Kernel-estimate of density of OLS and other estimators",xlab="")
lines(density(weightedestimator), col="lightblue2", lwd=3)
lines(density(lad), col="salmon", lwd=3)
lines(density(mle.t4), col="green", lwd=3)
lines(density(huberest), col="#949413", lwd=3)
abline(v=0,lty=2)
legend('topright', c("OLS","weighted","median", "MLE t, 4 df", "Huber"), col=c("purple","lightblue","salmon","green", "#949413"), lwd=3)