Normal bir denklem kanıtı hakkında soru


11

Normal denklemlerin: X'in ters çevrilebilir olduğu varsayımı olmadan bir veya daha fazla çözümü olduğunu nasıl kanıtlayabilirsiniz ?(XTX)β=XTY

Benim tek tahminim bunun genelleştirilmiş ters ile bir ilgisi var, ama tamamen kayboldum.


1
Şaşırtıcı cevaplar yaratan sorular sorarak puan kazanırsınız.
Nikana Reklawyks

Yanıtlar:


14

Biri glib olmak için caziptir ve buna işaret eder çünkü ikinci dereceden form

β(YXβ)(YXβ)

pozitif yarı tanımlı ise, minimum olduğu ve minimum olduğu (\ 'ye göre gradyanı β sıfıra ayarlayarak ) normal denklemlerle bulunan bir vardır.ββ

XX(YXβ)=0,

nereden olursa olsun rütbesinde en az bir çözümü olmalı XX . Bununla birlikte, bu argüman tamamen cebirsel bir ifade gibi görünen sorunun ruhunda görünmemektedir. Belki de böyle bir denklemin neden bir çözüme sahip olması gerektiğini ve tam olarak hangi koşullar altında olduğunu anlamak önemlidir. Öyleyse baştan başlayalım ve en az kareyle bağlantıyı bilmediğimizi varsayalım.


Her şey anlamını aşağı gelir , bir devrik X . Bu, basit bir tanım, uygun gösterim ve cömert olmayan seskilineer form kavramı olarak ortaya çıkacaktır. X'in n satırının (her gözlem için bir tane) ve p sütunlarının (varsa, bir sabit dahil olmak üzere her değişken için bir tane ) "tasarım matrisi" olduğunu hatırlayın . Bu nedenle vektör uzayı doğrusal bir dönüşüm temsil V = R, s için W = R , n .XXXnpV=RpW=Rn

Bir devrik bir şekilde bir düşünce, lineer transformasyon , bir lineer dönüşümdür çift boşluk X ' : W *V * . X X gibi bir kompozisyonu anlamak için, W ile W'yi tanımlamak gerekir . Yani her zamanki iç çarpım (karelerinin toplamı) ne W yapar.X X:WVXXWWW

Aslında V ve W üzerinde tanımlanmış iki iç ürün ve g W vardır . Bunlar, dejenere olmayan gerçek değerli bilinear simetrik fonksiyonlardır . İkincisi,gVgWVW

gW(u,v)=0 uWv=0,

için benzer ifadelerle . Geometrik olarak, bu iç ürünler uzunluk ve açıyı ölçmemizi sağlar. Durum gr ( u , v ) = 0 olarak düşünülebilir u için "dik" olmak v . Dejenerasyon, sadece sıfır vektörün tüm vektör uzayına dik olduğu anlamına gelir. (Bu genellik aracı Burada elde edilen sonuçlar için geçerli olduğunu genelleştirilmiş en küçük kareler olan ayarlama, g B zorunlu bileşenleri ürünlerin toplam olarak verilen iç çarpım değildir, ama bazı keyfi dejenere olmayan bir formudur. Bu sakınabileceğini ggVg(u,v)=0uvgW , X W : WV'yi tanımlamakla birlikte, birçok okuyucunun çift boşluklara aşina veya rahatsız olmasını bekliyorum ve bu yüzden bu formülasyondan kaçınmayı tercih ediyorum.)gVX:WV

Eldeki bu iç ürünlerle, herhangi bir doğrusal dönüşümün devrik tarafından tanımlanan X ' : WV ileX:VWX':WV

gV(X'(w),v)=gW(w,X(v))

tüm ve v V için . Aslında bu özelliğe sahip bir X ( w ) V vektörü bulunduğundan , V ve W için tabanlarla bir şeyler yazılarak oluşturulabilir ; bu vektörün benzersiz olduğunu, iç ürünlerin dejenerasyonundan kaynaklanmaktadır. Çünkü v 1 ve v 2 , g V ( v 1 , v ) = g V ( v 2 , v olan iki vektörsewWvVX'(w)VVWv1v2 tüm v V için , o zaman (birinci bileşendeki doğrusallıktan) g V ( v 1 - v 2 , v ) = 0 v 1 - v 2 = 0 anlamına gelentüm v için.gV(v1,v)=gV(v2,v)vVgV(v1-v2,v)=0vv1-v2=0

Tüm yazma U her vektöre dik tüm vektörlerin kümesi için U . Ayrıca gösterimde, yazma meselesi olarak X ( V ) ait görüntü için X kümesi olarak tanımlanan { X ( v ) | v V } W . Temel bir ilişki arasında X ve devrik X ' olduğuUW,UUX(V)X{X(v)|vV}WXX'

X'(w)=0wX(V).

Yani, çekirdeğindedir X ' , ancak ve ancak, eğer ağırlık görüntü dik X . wX'wX Bu iddia iki şey söylüyor:

  1. Eğer , o zaman g W ( W , X ( v ) ) = gr V ( X ' ( w ) , h ) = gr V ( 0 , v ) = 0 , tüm için v V sadece, w'nin X ( V ) 'ye dik olduğu anlamına gelir .X'(w)=0gW(w,X(v))=gV(X'(w),v)=gV(0,v)=0vVwX(V)

  2. Eğer dik olan X ( V ) sadece araçlarının, g B ( a , X, ( v ) ) = 0 , tüm için v V , ancak bu eşdeğerdir g V ( X ' ( w ) , h ) = 0 ve g V'nin dejenerasyonu, X ( w ) = 0 anlamına gelir .wX(V)gW(w,X(v))=0vVgV(X'(w),v)=0gVX'(w)=0

Aslında şimdi bitti. Analiz doğrudan ürün W = X ( V ) X ( V ) ⊥ olarak ayrıldığını göstermiştir . Kendisine, herhangi bir sunar rasgele y W gibi benzersiz bir şekilde mal y = y 0 + y ile y 0X ( V ) ve y X ( V ) . Bu y 0 demektirWW=X(V)X(V) yWy=y0+yy0X(V)yX(V)y0En az bir β V için formundadır . Dikkat edin, o zaman,X(β)βV

y-Xβ=(y0+y)-y0=yX(V)

Temel ilişki, söz konusu çekirdekte olmak sol tarafta aynıdır diyor :X

X'(y-Xβ)=0,

nereden Normal denklemler çözer X ' X β = X ' y .βX'Xβ=X'y.


Biz soruya kısa bir geometrik cevap vermek için bir konumda artık (bazı açıklayıcı yorumlarla birlikte): Normal denklemler bir çözüm çünkü herhangi -vector y W bir vektör toplamı olarak (benzersiz) bozunur y 0 yılında X aralığı ve y 0 ve y 0'a dik başka bir y vektörü en az bir p- vektörü β V'nin görüntüsüdür . Görüntünün boyutu X ( V ) ( sıralaması )nyWy0Xyy0y0pβVX(V)tanımlanabilir parametreler. çekirdeğinin boyutu , parametreler arasındaki önemsiz doğrusal ilişkileri sayar. Tüm parametreler tanımlanabilir X, bir bire-bir haritasıdır V onun görüntüye W .XXVW

Bu boşluk ile dökme sonuçta yararlıdır tamamen bölme odası ile tamamen ve iş U = X ( V ) W , matris "sütunu alanı" X . Normal denklemler U'ya dik çıkıntıya eşittir . Bu bizi kavramsal olarak modelin herhangi bir özel parametrelemesine bağlı kalmaktan kurtarır ve en küçük kareli modellerin nasıl parametrelendirildiklerinden bağımsız olarak içsel bir boyuta sahip olduğunu gösterir .VU=X(V)WXU


Bu soyut cebirsel gösterinin ilginç bir sonucu, keyfi vektör uzaylarındaki normal denklemleri çözebilmemizdir. Sonuç, örneğin, karmaşık alanlar için, sonlu alanlar üzerindeki (bir karelerin toplamını en aza indirmenin az olduğu) alanlar ve hatta uygun sıralı formları destekleyen sonsuz boyutlu alanlar için geçerlidir.


1
Daha sonraya kadar bu yanıtı kabul edecek temsilci hiç yoktu. Ben sadece bunun üzerine tökezledi ve tekrar teşekkür etmek istedim!
ryati

Ben o kuadratik formu yazardı yerine olarak p ( Y - X β ) ' ( Y - X β ) , gibi şeyler için ve kullanan diğer oka f : A B .
β(YXβ)(YXβ)
β(YXβ)(YXβ),
f:AB.
Michael Hardy

@Michael Yorumunuzda tipografik bir hata olmalı. Ne demek istediğini açıklığa kavuşturabilir misin?
whuber

@whuber: Tipografik bir hata bulamıyorum. Nokta iki ok olmasıdır ve '' farklı anlamlara sahiptir.''''
Michael Hardy

@Michael Birçok okumaya rağmen bu ayrımı görmediğim için beni affet. Ne olursa olsun, benim için ilk ok injektif bir fonksiyona, ikincisi ise herhangi bir fonksiyona atıfta bulunur, ancak sanırım niyetiniz bu değildir. Gösterimi açıklamak ister misin?
whuber

0

Örnek kümesinde en az iki farklı x -değeri (yordayıcı) varsa , X T X'in tersinin var olduğunu göstermek (kendiniz için rastgele sayıda nokta için deneyin) kolaydır . Tüm veriler varsa sadece aynı değerler x i = x (yani, istiflenmiş noktaları y dikey bir çizgi boyunca, yönünde), daha sonra herhangi bir hattı, ortalama çekilen ¯ y , yani rasgele bir eğime (regresyon katsayısı) sahip olacak o zaman LSE regresyon hattının benzersiz olmadığını.nXTXxxben=xyy¯


Bütünlük için basit doğrusal regresyon için, X = [ 1 x 11x m 1 ; ; 1 x 1 nx m n ] çoklu doğrusal regresyon için. X=[1 x1;1 x2;...;1 xn]X=[1 x11...xm1;...;1 x1n...xmn]
Lucozade

3
Yorumdaki çoklu regresyon referansı kafa karıştırıcıdır, çünkü bu cevap sadece bir kişinin daha yüksek boyutlu bir yüzeyden ziyade bir "çizgi" taktığı sıradan regresyon durumunda geçerlidir. Dahası, farklı bir soruyu cevaplamış gibi görünüyorsunuz: bu sadece tersine çevrilemediği durumu soruyor . X'X
whuber

0

Tipik regresyonda, X sıskadır ve bu nedenle kesinlikle tersine çevrilemez (tersine çevrilebilir olsa da). X'in sıska ve tersine çevrilebilir olması durumunda X ^ T * X'in tersine çevrilebilir olduğunu kanıtlamak (yardıma ihtiyacınız olup olmadığını sormak) kolaydır. Bu durumda, o zaman tam olarak bir çözüm olacaktır. Ve eğer X tam sütun sıralamasına sahip değilse, X ^ T * X tam sıra olmayacaktır ve bu nedenle az belirlenmiş bir sisteminiz olacaktır.


1
Bu sözler soruyu ele görünmüyor: bakılmaksızın rütbe , hala orada olacak mevcut bir çözüm. Örnek olarak, X'in tüm sıfırların bir matrisi olduğu uç durumu düşünün . Daha sonra normal denklemler 0 β = 0'a düşer ve herhangi bir β bir çözümdür. X'XX0β=0 β
whuber

whuber: tabii ki şu soruyu ele alıyorlar: X tam sütun sırası ise (bahsettiğim gibi) bir
soln

1
Sistemin "azımsanmış" olması, hiç bir çözümü olmadığı anlamına gelmez. Soru, çözümlerin varlığıyla ilgilidir.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.