Doğrusal regresyon katsayı tahminlerine analitik çözüm


9

Matris notasyonunu anlamaya çalışıyorum ve vektörler ve matrislerle çalışıyorum.

Şu anda çoklu regresyonda katsayı tahmin vektörünün nasıl hesaplandığını anlamak istiyorum .β^

Temel denklem

ddβ(yXβ)(yXβ)=0.

Şimdi burada bir vektör \ beta için nasıl çözerimβ ?

Düzenleme : Bekleyin, sıkıştım. Şimdi buradayım ve nasıl devam edeceğimi bilmiyorum:

ddβ((y1y2yn)(1x11x12x1p1x21x22x2p1xn1xn2xnp)(β0β1βp))((y1y2yn)(1x11x12x1p1x21x22x2p1xn1xn2xnp)(β0β1βp))

ddβi=1n(yi(1xi1xi2xip)(β0β1βp))2

İle için tüm kesişme söz konusu olur:xi0=1i

ddβi=1n(yik=0pxikβk)2

Beni doğru yöne yönlendirebilir misin?


@GaBorgulya, düzenleme için teşekkürler, bilmiyordum smallmatrix, bu yüzden düzenlemeye çalışmadı, çünkü birkaç satırda formülü kırmanın olağan çözümü burada işe yaramazdı.
mpiktas

Yanıtlar:


12

Sahibiz

ddβ(yXβ)(yXβ)=2X(yXβ) .

Denklemin bileşenlerle açıkça yazılmasıyla gösterilebilir. Örneğin, yerine . Sonra , , ..., ile ilgili türevleri alın ve cevabı almak için her şeyi istifleyin. Hızlı ve kolay bir örnek için ile başlayabilirsiniz .(β1,,βp)ββ1β2βpp=2

Tecrübe ile kişi, bazıları bu belgede verilen genel kurallar geliştirir .

Sorunun eklenen kısmı için rehberlik etmek üzere düzenleyin

İle Elimizdekip=2

(yXβ)(yXβ)=(y1x11β1x12β2)2+(y2x21β1x22β2)2

Kapsamında türev olanβ1

2x11(y1x11β1x12β2)2x21(y2x21β1x22β2)

Benzer şekilde, göre türevi olanβ2

2x12(y1x11β1x12β2)2x22(y2x21β1x22β2)

Bu nedenle, ilgili türev ile olduğuβ=(β1,β2)

(2x11(y1x11β1x12β2)2x21(y2x21β1x22β2)2x12(y1x11β1x12β2)2x22(y2x21β1x22β2))

Şimdi, son ifadeyi şu şekilde yeniden yazabileceğinizi gözlemleyin:

2(x11x21x12x22)(y1x11β1x12β2y2x21β1x22β2)=2X(yXβ)

Tabii ki, her şey daha büyük bir için aynı şekilde yapılır .p


Harika, tam olarak bu tür bir pdf arıyordum. Bir ton teşekkürler!
Alexander Engelhardt

Oh, şimdi kendim yapabileceğimi düşündüm, ama yapamam. Adımlarımın doğru olup olmadığını veya bunu çözmek için "başka bir yol" almam gerektiğini söyleyebilir misiniz?
Alexander Engelhardt

@Alexx Hardt: Düzenlemedeki ilk denklemim, p = 2 olduğu durumda son denkleminizle aynıdır. Böylece, 3, 4, ..., s bileşenleri için hesaplamalarımı taklit edebilirsiniz.
ocram

Tekrar teşekkürler :) Sanırım üç öneriyi de kullanacağım. Temel istatistik matrisi cebirini açıklayan ve özetleyen bir .pdf oluşturuyorum, çünkü derslerimde öğrendiğimde bir şekilde öğrenmek istemedim. Bunu üç farklı yolla çözmek, onu daha iyi anlamama yardımcı olacaktır, umarım.
Alexander Engelhardt

Oh, ama bu p = 2 ve n = 2 için, değil mi? Sanırım n = 3 ile yazacağım.
Alexander Engelhardt

13

Matrix yemek kitabındaki formülleri de kullanabilirsiniz . Sahibiz

(yXβ)(yXβ)=yyβXyyXβ+βXXβ

Şimdi her terimin türevlerini alın. olduğunu fark etmek isteyebilirsiniz . açısından teriminin türevi sıfırdır. Kalan terimβXy=yXβyyβ

βXXβ2yXβ

işlev biçimindedir

f(x)=xAx+bx,

sayfa 11'deki kitapta formül (88) 'de, , ve . Türev formül (89) 'da verilmektedir:x=βA=XXb=2Xy

fx=(A+A)x+b

yani

β(yXβ)(yXβ)=(XX+(XX))β2Xy

Şimdi beri istenen çözümü alıyoruz:(XX)=XX

XXβ=Xy

+1 mpiktas: Çözümünüz benimkinden daha dahice ve bence daha karmaşık pratik durumlarda kullanılmalı.
ocram

1
@ocram, teşekkürler. Buna ustaca demezdim, mevcut formüllerin standart bir uygulamasıdır. Sadece formülleri bilmeniz gerekir :)
mpiktas

8

İşte aslında daha genel ortamlara uygulamaları olan ve yararlı bulduğum regresyondaki karelerin toplamını en aza indirmek için bir teknik.

Vektör matris hesabından tamamen kaçınmaya çalışalım.

Diyelim ki burada , ve . Sadelik için ve olduğunu varsayıyoruz .

E=(yXβ)T(yXβ)=yXβ22,
yRnXRn×pβRppnrank(X)=p

Herhangi bir için β^Rp

E=yXβ^+Xβ^Xβ22=yXβ^22+X(ββ^)222(ββ^)TXT(yXβ^).

Biz Eğer seçim (bulun!) Bir vektör sağ taraftaki son dönem için sıfır olacak şekilde her o ima olacağından, o zaman biz, bitmiş olacaktır .β^ βminβEyXβ^22

Ancak, tüm için ve yalnızca ve bu son denklem yalnızca ise doğrudur . Böylece alınarak simge küçültülür .(ββ^)TXT(yXβ^)=0βXT(yXβ^)=0XTXβ^=XTyEβ^=(XTX)1XTy


Bu, hesabı önlemek için bir "hile" gibi görünse de, aslında daha geniş bir uygulamaya sahiptir ve oyunda bazı ilginç geometriler vardır.

Bu tekniğin bir türevi herhangi bir matris-vektör hesabı yaklaşımından çok daha basitleştirdiği bir örnek , matris durumunu genelleştirdiğimiz zamandır. Let , ve . parametrelerini tüm matris üzerinde en aza indirmek istediğimizi varsayalım . Burada bir kovaryans matrisidir.YRn×pXRn×qBRq×p

E=tr((YXB)Σ1(YXB)T)
BΣ

Yukarıdakilere tamamen benzer bir yaklaşım, alarak minimum ulaşıldığını hızlı bir şekilde belirler Yani, yanıtın kovaryans ile bir vektör olduğu ve gözlemlerin bağımsız olduğu bir regresyon ortamında, yanıtın bileşenleri üzerinde ayrı lineer regresyonlar yapılarak OLS tahmini elde edilir .E

B^=(XTX)1XTY.
Σp

Neyse ki forum kuralları her cevaba +1 eklenmesine izin veriyor. Eğitim için teşekkürler çocuklar!
DWin

@DWin, bunu soruya yapılan yorumların altına göndermek istediniz mi?
kardinal

Sanırım alabilirdim. Sırayla soruyu gözden geçirdim ve sonra tüm cevaplar (MathML'nin işlenmesinden sonra sarsıntıyı durdurduktan sonra) ve cevapların her birini bilgilendirici buldum. Ben sadece senin yorumumu bıraktım çünkü okumayı bıraktığım yer buydu.
DWin

1
@DWin, evet, render biraz korkak. Çünkü bu oy (yukarı veya aşağı) hiçbir oy vardır ve bu yüzden yorum yerinde görünüyordu başka bir yazı için yorum amaçlamış olabilir düşündüm. Şerefe.
kardinal

1
@cardinal +1, faydalı numara. Bu sorunun oldukça iyi bir referans olduğu ortaya çıktı.
mpiktas

6

Anlamanıza yardımcı olabilecek bir yol, matris cebirini kullanmamak ve her bir bileşene her saygıyla farklılaşmak ve ardından sonuçları bir sütun vektöründe "saklamak" tır. Böylece sahibiz:

βki=1N(Yij=1pXijβj)2=0

Şimdi sahip bu denklemlerin, her beta için birinin. Bu, zincir kuralının basit bir uygulamasıdır:p

i=1N2(Yij=1pXijβj)1(βk[Yij=1pXijβj])=0
2i=1NXik(Yij=1pXijβj)=0

Artık köşeli parantez içindeki toplamı Böylece:j=1pXijβj=xiTβ

i=1NXikYii=1NXikxiTβ=0

Şimdi bu denklemlerden var ve bunları bir sütun vektöründe "yığınlayacağız". Uyarı nasıl bağlıdır tek terimdir biz vektör içine bu yığını, böylece ve elde ederiz:pXikkxi

i=1NxiYi=i=1NxixiTβ

Şimdi betayı toplamın dışına çıkarabiliriz (ancak toplamın RHS'sinde kalmalıyız) ve sonra tersine çeviririz:

(i=1NxixiT)1i=1NxiYi=β
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.