Birkaç yıl önce öğrencilerime (ispanyolca) bu konuda bir makale yazdım, bu yüzden burada bu açıklamaları yeniden yazmaya çalışabilirim. Artan karmaşıklığın bir dizi örneği ile IRLS'ye (yinelemeli olarak en küçük kareler) bakacağım. İlk örnek için konum ölçeğinde bir aile kavramına ihtiyacımız var. bir anlamda sıfır merkezli bir yoğunluk fonksiyonu olsun . tanımlayarak bir yoğunluk ailesi oluşturabiliriz
burada bir ölçek parametresidir ve f ( x ) = f ( x ; μ , σ ) = 1f0σ>0μf0N(μ,σ)
f(x)=f(x;μ,σ)=1σf0(x−μσ)
σ>0μbir konum parametresidir. Her zamanki hata teriminin normal dağılım olarak modellenmiş olduğu ölçüm hatası modelinde, normal dağılım yerine yukarıda yapılandırıldığı gibi bir konum ölçeği ailesi kullanabiliriz. Tüm standart normal dağılımı, yukarıdaki yapı verir ailesi.
f0N(μ,σ)
Şimdi bazı basit örneklerde IRLS kullanacağız. İlk önce
yoğunluğunda
modelinde ML (maksimum olasılık) tahmincilerini
, Cauchy konum ailesini dağıtır (yani bu bir konum ailesidir). Ama önce bazı gösterimler. Ağırlıklı en küçük kareler tahmin verilir
burada bazı ağırlıklardır. ML tahmincisinin ile aynı formda ifade edilebileceğinif ( y ) = 1
Y1,Y2,…,Yni.i.d
μ μ μ ∗ = ∑ n i = 1 w i y if(y)=1π11+(y−μ)2,y∈R,
μμwı^ ıaısı=yı - ^ ı . L(y;μ)=(1μ∗=∑ni=1wiyi∑ni=1wi.
wbenμwbenkalıntıların bazı fonksiyonları
Olabilirlik fonksiyonu
ve mantıksallık işlevi
İle ilgili olarak onun türevi olduğunu
burada . Yazmak
εben= yben- μ^.
l(y)=-ngünlüğü(π)- n ∑ i=1günlüğü(1+(yi-μ)2). μ ∂ l ( y )L ( y; μ ) = ( 1π)nΠi = 1n11 + ( yben- μ )2
l ( y) = - n günlüğü( π) - ∑i = 1ngünlük( 1 + ( yben- μ )2) .
μ ϵi=yi-μf0(ϵ)=1∂l ( y)∂μ===0 - ∑ ∂∂μgünlük( 1 + ( yben- μ )2)- ∑ 2 ( yben- μ )1 + ( yben- μ )2⋅ ( - 1 )∑ 2 ϵben1 + ϵ2ben
εben= yben- μ f ′ 0 (ϵ)=1f0( ϵ ) =1π11 + ϵ2 ve ,
Biz bulmak
biz tanımı kullanılan
f ′ 0 (ϵ)f'0( ϵ ) = 1π- 1 ⋅ 2 ϵ( 1 + ϵ2)2∂ l ( y )f'0( ϵ )f0( ϵ )= - 1 ⋅ 2 ϵ( 1 + ϵ2)211 + ϵ2= - 2 ϵ1 + ϵ2.
∂l ( y)∂μ===- ∑ f'0( ϵben)f0( ϵben)- ∑ f'0( ϵben)f0( ϵben)⋅ ( - 1εben) ⋅(- ϵben)∑ wbenεben
wben= f'0( ϵben)f0( ϵben)⋅ ( - 1εben) = - 2 ϵben1 + ϵ2ben⋅ ( - 1εben) = 21 + ϵ2ben.
Hatırlamasıdır
, bu denklemi elde
IRLS arasında tahmin denklemidir. Bunu not et
εben= yben- μ∑ wbenyben= μ ∑ wben,
- ağırlıkları her zaman pozitiftir.wben
- Kalıntı büyükse, ilgili gözlemlere daha az ağırlık veririz.
Uygulamada ML tahmincisini hesaplamak için bir başlangıç değerine ihtiyacımız var , örneğin medyanı kullanabiliriz. Bu değeri kullanarak
ve ağırlıklarını
nın
yeni değeri
Bu şekilde devam ederek
ve
Algoritmanın
geçişindeki tahmini değerμ^( 0 )
ε( 0 )ben= yben- μ^( 0 )
w( 0 )ben= 21 +ϵ(0 )ben.
μ^μ^( 1)= ∑ w( 0 )benyben∑ w( 0 )ben.
ε( j )ben=yben-μ^( j )
w( j )ben=21 + ϵ( j )ben.
j + 1μ^( j + 1 )= ∑ w( j )benyben∑ w( j )ben.
Devam sekansı kadar
yakınsak.
μ^( 0 ), μ^( 1 ), … , Μ^( j ), …
Şimdi bu süreci daha genel bir yer ve ölçek ailesi, ile daha az ayrıntıyla . Let yukarıdaki yoğunluğu ile bağımsız olması. Ayrıca tanımlayın . Mantıksallık işlevi
yazarken ,
ve
Mantıksallık türevinin hesaplanması
f(y) = 1σf0(y- μσ)Y1, Y2, … , Ynεben= yben- μσ
l (y) = - n2günlük( σ2) + ∑ günlük( f0( yben- μσ) ).
ν= σ2∂εben∂μ= - 1σ
∂εben∂ν= ( yben- μ ) ( 1ν--√)'= ( yben- μ ) ⋅ - 12 σ3.
∂l ( y)∂μ= ∑ f'0( ϵben)f0( ϵben)⋅ ∂εben∂μ= ∑ f'0( ϵben)f0( ϵben)⋅( - 1σ) = - 1σΣf'Ö(ϵben)f0(ϵben)⋅ ( - 1εben) (- ϵben)=1σΣwbenεben
ve bunu sıfıra ilk örnekle aynı tahmin denklemini verir. Sonra için bir tahminci :
σ2∂l (y)∂ν=====- n21ν+ ∑ f'0( ϵben)f0( ϵben)⋅ ∂εben∂ν- n21ν+ ∑ f'0( ϵben)f0( ϵben)⋅ ( - ( yben- μ )2 σ3)- n21ν- 121σ2∑ f'0( ϵben)f0( ϵben)⋅ ϵben- n21ν- 121ν∑ f'0( ϵben)f0( ϵben)⋅ ( - 1εben) (- ϵben) ⋅ ϵben- n21ν+ 121ν∑ wbenε2ben=!0.
tahmincisi giden
Yukarıdaki yinelemeli algoritma bu durumda da kullanılabilir.
σ2^= 1n∑ wben( yben- μ^)2.
Aşağıda R'yi kullanarak, çift üstel model (bilinen skala ile) ve verilerle sayısal bir inceleme yapıyoruz y <- c(-5,-1,0,1,5)
. Bu veriler için ML tahmincisinin gerçek değeri 0'dır. Başlangıç değeri olacaktır mu <- 0.5
. Algoritmanın bir geçişi
iterest <- function(y, mu) {
w <- 1/abs(y-mu)
weighted.mean(y,w)
}
bu fonksiyon ile "elle" iterasyonlarını deneyebilirsiniz Sonra tekrarlamalı algoritma tarafından yapılabilir
mu_0 <- 0.5
repeat {mu <- iterest(y,mu_0)
if (abs(mu_0 - mu) < 0.000001) break
mu_0 <- mu }
Alıştırma: Eğer model scale parametresi ile dağılımı ise yinelemeler ağırlığı ile verilmiştir
Alıştırma: Yoğunluk lojistik ise, ağırlıkların tarafından verildiğini gösterin
tkσw(ϵ)=1-eϵ
wben= k + 1k + ϵ2ben.
w ( ϵ ) = 1 - eε1 + eε⋅ - 1ε.
Şimdilik burada bırakacağım, bu yazıyı sürdüreceğim.