OLS tahmincisinin ölçek eşdeğeri olduğunu mu gösteriyorsunuz?


11

Ölçek eşdeğerliğinin resmi bir tanımı yok, ama burada İstatistiksel Öğrenmeye Giriş bu konuda s. 217:

Standart en küçük kareler katsayıları ... ölçek : sabit bir çarpmak , en küçük kareler katsayısı tahminlerinin faktörüyle ölçeklenmesine yol açar .Xjc1/c

Basit olması için, genel doğrusal modelini varsayalım , burada \ mathbb {R} ^ N , \ mathbf {X } , \ mathbb {R} , \ mathbb {R} ^ {p + 1} ve \ içindeki tüm girişleri içeren bir N \ times (p + 1) matrisidir (burada p + 1 <N ). boldsymbol \ epsilon , \ mathbb {E} [\ boldsymbol \ epsilon] = \ mathbf {0} _ {N \ times 1} olan gerçek değerli rastgele değişkenlerin N boyutlu bir vektörüdür .y=Xβ+ϵyRNXN×(p+1)p+1<NRβRp+1ϵNE[ϵ]=0N×1

OLS tahmininden, X tam (sütun) sıralaması varsa,

β^X=(XTX)1XTy.
Varsayalım X , xk için {mathbf {x} _k sütununu k{1,2,,p+1} , sabit bir c0 . Bu matrise eşdeğer olur
X[111c11]S=[x1x2cxkxp+1]X~
matris diğer tüm girişler S üzerindedir 0 ve c olan k diyagonalinin inci giriş S . Sonra,X~X~yeni tasarım matrisi
β^X~=(X~TX~)1X~Ty.
Bazı çalışmalardan sonra,
X~TX~=[x1Tx1x1Tx2cx1Txkx1Txp+1x2Tx1x2Tx2cx2Txkx2Txp+1cxkTx1cxkTx2c2xkTxkcxkTxp+1xp+1Tx1xp+1Tx2cxp+1Txp+1xp+1Txp+1]
\ cdots & \ mathbf {x} _ {p + 1} ^ {T} \ mathbf {x} _ {p + 1} \\ \ end {bmatrix} ve
X~Ty=[x1Tyx2TycxkTyxp+1Ty]
Yukarıda belirtilen hak talebini göstermek için buradan nasıl giderim (yani, )? Bana nasıl hesaplanacağı belli değil (\ tilde {\ mathbf {X}} ^ {T} \ tilde {\ mathbf {X}}) ^ {- 1} .( ~ x T ~ X )-1β^X~=1cβ^X(X~TX~)1

Bence doğru değil, bir satırda bir çarpanı eksik . cX~TX~c
Firebug

1
Ayrıca, iddianın unutmayın. . ββ^k,new=1cβ^k,oldβ
Firebug

@Firebug Evet, bunu anladım. Bir cevap gönderiyorum.
Klarnetçi

2
Sen yerini alabilecek bütün çarparak, çünkü çok daha basit birimler analizi ile bu cebir tarafından sadece ölçüm birimlerini değiştirir ve bu nedenle onun katsayısı ile ilişkili birimlerinde gelen değişim bölerek etmektir . Kanıtlamaz bölünmelidir maalesef. Ancak, bu düşünce zinciri çoklu regresyon kadar açık olduğu bir zamanda, az bir regresör karşı regresyon bir arkaya yapılabilir olduğunu hatırlatıyor olabilir bölünür ve ispat tamamlanır böylece. c β j c β j cXjcβjcβ^jccβ^jc
whuber

@whuber, sonucun sezgisi açık olsa da, bir kanıt sunarken biraz cebir olmalı gibi görünüyor. Sonuçta, ölçeklendirme faktörü ters çevrilmelidir. c
user795305

Yanıtlar:


11

Teklifteki iddia , sütunlarını yeniden ölçeklendirmeyle ilgili bir ifade koleksiyonu olduğundan , hepsini bir kerede kanıtlayabilirsiniz. Gerçekten de, iddianın genelleştirilmesini kanıtlamak için daha fazla iş gerektirmez:X

Zaman tersinir ve matris ile sağ çarpılır , daha sonra yeni katsayısı tahmin eşittir yan çarpılır sol .bir β bir β A - 1XAβ^Aβ^A1

İhtiyacınız olan tek cebirsel gerçek ve matrisleri için olan (kolayca kanıtlanmış, iyi bilinen). ve ters çevrilebilir matrisleri için . (Genelleştirilmiş tersleri çalışırken ikinci bir daha ince versiyonu gereklidir: tersi için ve ve bir , . ) A B ( A B ) - 1 = B - 1 A - 1 A B A B X ( A X B ) - = B - 1 X - A - 1(AB)=BAAB(AB)1=B1A1ABABX(AXB)=B1XA1


göre kanıt :

β^A=((XA)((XA))(XA)y=A1(XX)(A)1Ay=A1β^,

QED. (Bu kanıtın tamamen genel olması için üst simge genelleştirilmiş bir tersi ifade eder.)


Geometri ile kanıt :

Verilen bazlar ve arasında ve , sırasıyla bir lineer transformasyonu temsil eden için . Sağ-çarpma ile olarak kabul edilebilir bu dönüşüm sabit bırakarak ama değişen için (kolonlarına, bir ). Temelinde bu değişikliğin altında temsili bir vektör sol-çarpma ile değiştirmek gerekir ,E n R n R p X R p R n X AEpEnRnRpXRpRnXA AEpAEpAβ^RpA1QED .

(Bu kanıt değiştirilmez, ters çevrilemese bile çalışır .)XX


Tırnak özellikle diyagonal matris halinde ifade eder ile için ve .AAii=1ijAjj=c


En küçük karelerle bağlantı

Buradaki amaç, sonucu elde etmek için ilk prensipleri kullanmaktır, prensip en az karelerdir: artıkların karelerinin toplamını en aza indiren katsayıları tahmin etmek.

Yine, (büyük) bir genellemenin kanıtlanması artık zor değildir ve oldukça açıklayıcıdır. Diyelim ki , gerçek vektör uzaylarının herhangi bir haritası (doğrusal ya da değil) ve üzerindeki herhangi bir gerçek değerli fonksiyon olduğunu varsayalım . Let noktalarının (boş) kümesi olan en aza indirilir.

ϕ:VpWn
QWnUVpvQ(ϕ(v))

Sonuç: Yalnızca ve tarafından belirlenen , vektörleri temsil etmek için kullanılan temeli seçimine bağlı değildir .UQϕEpVp

İspat: QED.

Kanıtlayacak bir şey yok!

Sonuç Uygulanması: Let üzerinde olumlu yarı kesin karesel formu , izin ve varsayalım bir doğrusal ile temsil edilen haritanın zaman tabanları ve seçilir. tanımlayın . bir temel seçin ve varsayalım , bu temelde bazı nin temsilidir . Bu en küçük karelerdir : , kare mesafesini en aza indirir . ÇünküFRnyRnϕXVp=RpWn=RnQ(x)=F(y,x)Rpβ^vUx=Xβ^F(y,x)X tabanını değiştirerek, bazı ters çevrilebilir matrisinin ile sağa karşılık gelen doğrusal bir haritadır . O irade sol çarpma tarafından , QED .RpXAβ^A1


6

β^=argminβRpyXβ22XRn×pSRp×p

Bu yeni ölçekli tahminciyi tanımlayın . Bu , tüm için . tanımlayarak , yukarıda görüntülenen bu eşitsizliği olarak herkes için . Bu nedenle ve en küçük kareler tahmincisinin ölçekleme matrisinin ters çevrilebilirliği nedeniyleα~=argminαRpyXSα22

yXSα~22<yXSα22
αα~β~=Sα~
yXβ~22<yXβ22
ββ~β~=argminβRpyXβ22
β^=β~=Sα~.
S, izler . Bizim durumumuzda, bu tek farklılık ile girişi tarafından boyutlandırıldıktan .α~=S1β^β^kth1c

1
ve benzeri işlevlerle çalışmam gerektiği için aşina değilim - ikinci denkleminizden üçüncü denklem satırına geçişi açıklayabilir misiniz? arg min
Clarinetist

Biraz farklı yazdım, bu da adımları daha net hale getirmeli.
user795305

Bu gerçekten zekice. (+1)
Klarnetçi

4

Soruyu gönderdikten sonra bunu anladım. İşim doğruysa, iddiayı yanlış yorumladım. ölçeklendirme sadeceβ 'nin bir sütununda karşılık gelenXsütunununcile çarpılmasıyla gerçekleşir.1cβXc

Uyarı bu , yukarıdaki gösterimde, bir köşegen, simetriktir ( p + 1 ) x ( p + 1 ) matrisi ve (bu diyagonal olduğu için) ters olan S - 1 = [ 1S(p+1)×(p+1) Not( ~ x T ~ X )-1olan bir(p+1)x(p+1)matrisi. Diyelim ki (XTX)-1=[ z 1 z 2z kz p + 1 ]. Sonra da ( ˜ X T ˜ X

S1=[1111c11].
(X~TX~)1(p+1)×(p+1)
(XTX)1=[z1z2zkzp+1].
Bu nedenle, S - 1 ( X, T x )
(X~TX~)1=[(XS)TXS]1=(STXTXS)1=(SXTXS)1=S1(XTX)1S1.
ve bu çarpılmasıS-1çarparak ne benzer bir etkiye sahiptirXileSyaptı - hariç aynı kalır1
S1(XTX)1=[z1z21czkzp+1]
S1XS1ile çarpılır1czk : S-1(XTX)-1S-1=[ z 11c Bu nedenle, β ~ X
S1(XTX)1S1=[z1z21c2zkzp+1].
istendiği gibi.
β^X~=S1(XTX)1S1(XS)Ty=[z1z21c2zkzp+1][x1Tyx2TycxkTyxp+1Ty]=[z1x1Tyz2x2Ty1czkxkTyzp+1xp+1Ty]

Bir yanlış bulunmaktadır . Transpoze etmeniz gerekir ( X S ) . S1(XTX)1S1(XS)y(XS)
JohnK

3

Şimdiye Kadarki En Önemsiz Kanıt

Doğrusal denkleminizle başlıyorsunuz: Şimdi regresörlerinizin ölçeğini değiştirmek istiyorsunuz, belki metrik sistemden İmparatorluk'a dönüştürebilirsiniz, kilogramı pound, metre ila yard vb. dönüşüm matrisi S = d i a g ( s 1 , s 1 , , s n ) burada her s i , tasarım matrisindeki X değişkeni (sütun) i için dönüşüm katsayısıdır .

Y=Xβ+ε
S=diag(s1,s1,,sn)siiX

Denklemi yeniden yazalım:

Y=(XS)(S1β)+ε

Ölçeklemenin, katsayıların tahmininde OLS yöntemi değil, denkleminizin doğrusallığının özelliği olduğu çok açıktır. Ne olursa olsun lineer denklemle tahmin yönteminin size önsavının olarak ölçeklenirken o buna sahip Yeni katsayılar olarak ölçekli edilmelidir S - 1 pXSS1β

Sadece OLS için Cebir Kanıtı

: Ölçekleme bu burada s ı , her bir değişken (kolon) ölçek faktörü, ve Z, bir ölçekli versiyonu X . Let matris çapraz ölçek çağrı S d ı bir gr ( s 1 , s 2 , . . . , S , n )

Z=Xdiag(s1,s2,...,sn)
siZXSdiag(s1,s2,...,sn). İşletme OLS tahmin olan β = ( X , T x ) - 1 x T -Y Let fişi ölçekli matris Z yerine , X ve bazı kullanma matris cebir : ( Z , T , Z ) - 1 , Z , T , Y = ( S , T x T X S ) - 1 S T X T Y = S - 1 ( X T
β^=(XTX)1XTY
ZX So, yeni katsayı basitçe beklendiği gibi eski katsayı, küçültülmüş nasıl görüyoruz.
(ZTZ)1ZTY=(STXTXS)1STXTY=S1(XTX)1S1SXTY=S1(XTX)1XTY=S1β^

2
δ:MRpM(X,Y)Rpδ(X,Y)=S1δ(XS,Y)SXY

@whuber, aslında başka bir yol: makul montaj prosedürü bu koşulu karşılamalıdır, aksi takdirde basit bir ölçü birimi değişikliği farklı bir tahmin / tahmin üretecektir. cevabımı güncelleyeceğim, biraz düşüneceğim
Aksakal

X

3
imparatorluk arkadaşı, kraliyet değil ...: D (Güzel cevap, +1)
usεr11852

@ usεr11852, bugün bir şeyler öğrendim :)
Aksakal

2

y^yX. β^y^Xc1/c

bbenβ^birbenc.

b1x1+...+bbenxben+...+bmxm=bir1x1+...birben(cxben)+...+birnxn

bj=birjjbenbben=birbencX

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.