Etki fonksiyonları ve OLS


15

Etki işlevlerinin nasıl çalıştığını anlamaya çalışıyorum. Birisi basit bir OLS regresyonu bağlamında açıklayabilir mi?

yi=α+βxi+εi

Burada için etki fonksiyonunu istiyorum .β


2
Burada henüz özel bir soru yok: Etki işlevinin nasıl hesaplandığını görmek ister misiniz? Belirli bir ampirik örnek ister misiniz? Ne anlama geldiğinin sezgisel bir açıklaması mı?
whuber

1
Frank Critchley'nin 1986 tarihli makalesine bakarsanız "temel bileşenlerdeki işlevleri etkileme" (makalenin tam adını hatırlayamıyorum). Burada sıradan gerileme için etki işlevini tanımlar (bu benim cevabımı yanlış kanıtlayabilir veya kanıtlamayabilir).
olasılık

Yanıtlar:


15

Etki fonksiyonları temel olarak, bir istatistiğin değeri üzerindeki bir gözlemin bu istatistiği yeniden hesaplamak zorunda kalmadan etkisini (veya "etkisini") değerlendirmek için kullanılabilecek analitik bir araçtır . Asimptotik varyans tahminleri oluşturmak için de kullanılabilirler. Etkisi eşitse o zaman asimptot varyansıdır .ben 2II2n

Etki işlevlerini anlama şeklim aşağıdaki gibidir. ile gösterilen bir çeşit teorik . Basit OLS için,Fi(y)=Pr(Yi<yi)

Φ(z)σ2S(F)FFF(i)(z)=(1+ζ)F(z)-ζδ(i)(z)δi(z)=I(yi<z)ζ=1

Pr(Yi<yi)=Pr(α+βxi+ϵi<yi)=Φ(yi(α+βxi)σ)
Burada standart normal CDF ve hata sapmasıdır. Artık herhangi istatistik dolayısıyla bu CDF'nin bir fonksiyonu, gösterim olacağını gösterebilir (yani bazı fonksiyonu ). Şimdi işlevini "biraz" olarak değiştirdiğimizi varsayalım , Nerede ve . Bu nedenle , "iith" veri noktası kaldırılmış olarak verilerin CDF'sini temsil eder. Taylor serisi yapabilirizΦ(z)σ2S(F)FFF(i)(z)=(1+ζ)F(z)ζδ(i)(z)δi(z)=I(yi<z) F(i)F(i)(z)ζ=0ζ=1n1F(i)F(i)(z) yaklaşık . Bu şunu verir:ζ=0

S[F(i)(z,ζ)]S[F(i)(z,0)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

olduğuna dikkat edin : S [ F ( i ) ( z , ζ ) ] S [ F ( z ) ] + ζ [ S [ F ( i ) ( z , ζ ) ]F(i)(z,0)=F(z)

S[F(i)(z,ζ)]S[F(z)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

Buradaki kısmi türeve etki fonksiyonu denir. Bu, "i" gözleminin silinmesi nedeniyle bir istatistiğe yapılacak yaklaşık "birinci dereceden" düzeltmeyi temsil eder. Regresyonda, kalanın asimtotik olarak sıfıra gitmediğini, böylece bunun gerçekten alabileceğiniz değişikliklere bir yaklaşım olduğunu unutmayın. Şimdi :β

β=1nΣj=1n(yj-y¯)(xj-x¯)1nΣj=1n(xj-x¯)2

Dolayısıyla beta iki istatistiğin bir fonksiyonudur: X'in varyansı ve X ve Y arasındaki kovaryans. Bu iki istatistik, CDF açısından aşağıdaki gibi temsillere sahiptir:

v a r ( X ) = ( X - μ x ( F ) ) 2 d F μ x = x d F

cÖv(X,Y)=(X-μx(F))(Y-μy(F))dF
ve burada
vbirr(X)=(X-μx(F))2dF
μx=xdF

İ'inci gözlemi kaldırmak için , her iki integralde de değiştiriyoruz:FF(ben)=(1+ζ)F-ζδ(ben)

μx(ben)=xd[(1+ζ)F-ζδ(ben)]=μx-ζ(xben-μx)
Vbirr(X)(ben)=(X-μx(ben))2dF(ben)=(X-μx+ζ(xben-μx))2d[(1+ζ)F-ζδ(ben)]

koşullarını göz ardı ederek elde ettiğimizi basitleştiriyoruz: Benzer şekilde ζ2

Vbirr(X)(ben)Vbirr(X)-ζ[(xben-μx)2-Vbirr(X)]
CÖv(X,Y)(ben)CÖv(X,Y)-ζ[(xben-μx)(yben-μy)-CÖv(X,Y)]

Böylece işlevini işlevi olarak ifade edebiliriz . Bu:β(ben)ζ

β(ben)(ζ)CÖv(X,Y)-ζ[(xben-μx)(yben-μy)-CÖv(X,Y)]Vbirr(X)-ζ[(xben-μx)2-Vbirr(X)]

Şimdi Taylor serisini kullanabiliriz:

β(ben)(ζ)β(ben)(0)+ζ[β(ben)(ζ)ζ]ζ=0

Bunu basitleştirmek:

β(ben)(ζ)β-ζ[(xben-μx)(yben-μy)Vbirr(X)-β(xben-μx)2Vbirr(X)]

Ve , , ve istatistiklerinin değerlerini elde ederiz:μyμxvbirr(X)ζ=1n-1

β(ben)β-xben-x¯n-1[yben-y¯1nΣj=1n(xj-x¯)2-βxben-x¯1nΣj=1n(xj-x¯)2]

Tek bir gözlemin kaldırılmasının etkisinin, modeli yeniden sığdırmak zorunda kalmadan nasıl yakınlaştırılabileceğini görebilirsiniz. Ayrıca, ortalamanın eşit bir x değerinin çizginin eğimi üzerinde nasıl bir etkisi olmadığını görebilirsiniz . Bunu düşünün ve bunun nasıl mantıklı olduğunu göreceksiniz. Bunu, standart değerleri açısından da daha özlü bir şekilde yazabilirsiniz :x~=x-x¯sx

β(ben)β-xben~n-1[yben~sysx-xben~β]

Hikaye ek veri noktasının etkisi hakkında mı? Daha çok zaman serisi verileri için dürtü yanıtına alışkındım, istatistiksel bağlamda tüm etkiler marjinal etki veya standart regresyondan (daha iyi seçim) beta katsayısı ile tanımlanacaktır. Soruyu ve cevabı yargılamak için gerçekten daha fazla içeriğe ihtiyacım var, ama bu güzel, sanırım (+1 henüz değil ama bekliyor).
Dmitrij Celov

@dmitrij - Bağlantıdan ima edilen (ya da çıkarım yaptığım) şey bu - bir istatistiğin sağlamlık özellikleriyle ilgilidir. Etki işlevleri 1 veri noktasından biraz daha geneldir - delta işlevini bunların bir toplamı olarak yeniden tanımlayabilirsiniz (çok fazla gözlem). Bunu bir dereceye kadar bir "ucuz Jacknife" olarak düşünürdüm - çünkü modelin yeniden takılmasını gerektirmezsiniz.
olasılık

10

İşte bir regresyonun etki fonksiyonları hakkında konuşmanın süper genel bir yolu. İlk olarak etki fonksiyonlarını sunmanın bir yolunu ele alacağım:

Diyelim ki üzerinde bir dağılımdır . Kirlenmiş dağılım fonksiyonu , , aşağıdaki gibi tanımlanabilir: burada olasılık ölçüsüdür olan atar olasılık 1 ve 0 öğesinin diğer tüm öğelerine .FΣFε(x)

Fε(x)=(1-ε)F+εδx
δxΣ{x}Σ

Buradan etki fonksiyonunu oldukça kolay bir şekilde tanımlayabiliriz:

Etkisi fonksiyonu arasında de , gibi tanımlanmıştır: θ^Fψben:XΓ

ψθ^,F(x)=limε0θ^(Fε(x))-θ^(F)ε

Buradan bir etkisi fonksiyonu Gateaux türevi olduğunu görmek mümkündür de yönünde . Bu, etki fonksiyonlarının (benim için) yorumunu biraz daha açık hale getirir: Bir etki fonksiyonu, belirli bir gözlemin tahminci üzerindeki etkisini anlatır.θ^Fδx

OLS tahmini soruna bir çözümdür:

θ^=argminθE[(Y-Xθ)T(Y-Xθ)]

Gözleme biraz daha fazla ağırlık veren kirlenmiş bir dağılım düşünün :(x,y)

θ^ε=argminθ(1-ε)E[(Y-Xθ)T(Y-Xθ)]+ε(y-xθ)T(y-xθ)

İlk sipariş koşullarını alma:

{(1-ε)E[XTX]+εxTx}θ^ε=(1-ε)E[XTY]+εxTy

Etki fonksiyonu sadece bir Gateaux türevi olduğu için şimdi şunu söyleyebiliriz:

-(E[XTX]+xTx)θ^ε+E[XTX]ψθ(x,y)=-E[XTY]+xTy

En , , yani:ε=0θ^ε=θ^=E[XTX]-1E[XTY]

ψθ(x,y)=E[XTX]-1xT(y-xθ)

Bu etki fonksiyonunun sonlu örnek karşılığı:

ψθ(x,y)=(1N-ΣbenXbenTXben)-1xT(y-xθ)

Genel olarak bu çerçevenin (Gateaux türevleri olarak etki fonksiyonları ile çalışmak) başa çıkmayı daha kolay buldum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.