Normal denklemlerin: X'in ters çevrilebilir olduğu varsayımı olmadan bir veya daha fazla çözümü olduğunu nasıl kanıtlayabilirsiniz ?
Benim tek tahminim bunun genelleştirilmiş ters ile bir ilgisi var, ama tamamen kayboldum.
Normal denklemlerin: X'in ters çevrilebilir olduğu varsayımı olmadan bir veya daha fazla çözümü olduğunu nasıl kanıtlayabilirsiniz ?
Benim tek tahminim bunun genelleştirilmiş ters ile bir ilgisi var, ama tamamen kayboldum.
Yanıtlar:
Biri glib olmak için caziptir ve buna işaret eder çünkü ikinci dereceden form
pozitif yarı tanımlı ise, minimum olduğu ve minimum olduğu (\ 'ye göre gradyanı β sıfıra ayarlayarak ) normal denklemlerle bulunan bir vardır.
nereden olursa olsun rütbesinde en az bir çözümü olmalı . Bununla birlikte, bu argüman tamamen cebirsel bir ifade gibi görünen sorunun ruhunda görünmemektedir. Belki de böyle bir denklemin neden bir çözüme sahip olması gerektiğini ve tam olarak hangi koşullar altında olduğunu anlamak önemlidir. Öyleyse baştan başlayalım ve en az kareyle bağlantıyı bilmediğimizi varsayalım.
Her şey anlamını aşağı gelir , bir devrik X . Bu, basit bir tanım, uygun gösterim ve cömert olmayan seskilineer form kavramı olarak ortaya çıkacaktır. X'in n satırının (her gözlem için bir tane) ve p sütunlarının (varsa, bir sabit dahil olmak üzere her değişken için bir tane ) "tasarım matrisi" olduğunu hatırlayın . Bu nedenle vektör uzayı doğrusal bir dönüşüm temsil V = R, s için W = R , n .
Bir devrik bir şekilde bir düşünce, lineer transformasyon , bir lineer dönüşümdür çift boşluk X ' : W * → V * . X ′ X gibi bir kompozisyonu anlamak için, W ∗ ile W'yi tanımlamak gerekir . Yani her zamanki iç çarpım (karelerinin toplamı) ne W yapar.
Aslında V ve W üzerinde tanımlanmış iki iç ürün ve g W vardır . Bunlar, dejenere olmayan gerçek değerli bilinear simetrik fonksiyonlardır . İkincisi,
için benzer ifadelerle . Geometrik olarak, bu iç ürünler uzunluk ve açıyı ölçmemizi sağlar. Durum gr ( u , v ) = 0 olarak düşünülebilir u için "dik" olmak v . Dejenerasyon, sadece sıfır vektörün tüm vektör uzayına dik olduğu anlamına gelir. (Bu genellik aracı Burada elde edilen sonuçlar için geçerli olduğunu genelleştirilmiş en küçük kareler olan ayarlama, g B zorunlu bileşenleri ürünlerin toplam olarak verilen iç çarpım değildir, ama bazı keyfi dejenere olmayan bir formudur. Bu sakınabileceğini g , X W : W → V ∗ 'yi tanımlamakla birlikte, birçok okuyucunun çift boşluklara aşina veya rahatsız olmasını bekliyorum ve bu yüzden bu formülasyondan kaçınmayı tercih ediyorum.)
Eldeki bu iç ürünlerle, herhangi bir doğrusal dönüşümün devrik tarafından tanımlanan X ' : W → V ile
tüm ve v ∈ V için . Aslında bu özelliğe sahip bir X ′ ( w ) ∈ V vektörü bulunduğundan , V ve W için tabanlarla bir şeyler yazılarak oluşturulabilir ; bu vektörün benzersiz olduğunu, iç ürünlerin dejenerasyonundan kaynaklanmaktadır. Çünkü v 1 ve v 2 , g V ( v 1 , v ) = g V ( v 2 , v olan iki vektörse tüm v ∈ V için , o zaman (birinci bileşendeki doğrusallıktan) g V ( v 1 - v 2 , v ) = 0 v 1 - v 2 = 0 anlamına gelentüm v için.
Tüm yazma U ⊥ her vektöre dik tüm vektörlerin kümesi için U . Ayrıca gösterimde, yazma meselesi olarak X ( V ) ait görüntü için X kümesi olarak tanımlanan { X ( v ) | v ∈ V } ⊂ W . Temel bir ilişki arasında X ve devrik X ' olduğu
Yani, çekirdeğindedir X ' , ancak ve ancak, eğer ağırlık görüntü dik X . Bu iddia iki şey söylüyor:
Eğer , o zaman g W ( W , X ( v ) ) = gr V ( X ' ( w ) , h ) = gr V ( 0 , v ) = 0 , tüm için v ∈ V sadece, w'nin X ( V ) 'ye dik olduğu anlamına gelir .
Eğer dik olan X ( V ) sadece araçlarının, g B ( a , X, ( v ) ) = 0 , tüm için v ∈ V , ancak bu eşdeğerdir g V ( X ' ( w ) , h ) = 0 ve g V'nin dejenerasyonu, X ′ ( w ) = 0 anlamına gelir .
Aslında şimdi bitti. Analiz doğrudan ürün W = X ( V ) ⊕ X ( V ) ⊥ olarak ayrıldığını göstermiştir . Kendisine, herhangi bir sunar rasgele y ∈ W gibi benzersiz bir şekilde mal y = y 0 + y ⊥ ile y 0 ∈ X ( V ) ve y ⊥ ∈ X ( V ) ⊥ . Bu y 0 demektir En az bir β ∈ V için formundadır . Dikkat edin, o zaman,
Temel ilişki, söz konusu çekirdekte olmak sol tarafta aynıdır diyor :
nereden Normal denklemler çözer X ' X β = X ' y .
Biz soruya kısa bir geometrik cevap vermek için bir konumda artık (bazı açıklayıcı yorumlarla birlikte): Normal denklemler bir çözüm çünkü herhangi -vector y ∈ W bir vektör toplamı olarak (benzersiz) bozunur y 0 yılında X aralığı ve y 0 ve y 0'a dik başka bir y ⊥ vektörü en az bir p- vektörü β ∈ V'nin görüntüsüdür . Görüntünün boyutu X ( V ) ( sıralaması )tanımlanabilir parametreler. çekirdeğinin boyutu , parametreler arasındaki önemsiz doğrusal ilişkileri sayar. Tüm parametreler tanımlanabilir X, bir bire-bir haritasıdır V onun görüntüye W .
Bu boşluk ile dökme sonuçta yararlıdır tamamen bölme odası ile tamamen ve iş U = X ( V ) ⊂ W , matris "sütunu alanı" X . Normal denklemler U'ya dik çıkıntıya eşittir . Bu bizi kavramsal olarak modelin herhangi bir özel parametrelemesine bağlı kalmaktan kurtarır ve en küçük kareli modellerin nasıl parametrelendirildiklerinden bağımsız olarak içsel bir boyuta sahip olduğunu gösterir .
Bu soyut cebirsel gösterinin ilginç bir sonucu, keyfi vektör uzaylarındaki normal denklemleri çözebilmemizdir. Sonuç, örneğin, karmaşık alanlar için, sonlu alanlar üzerindeki (bir karelerin toplamını en aza indirmenin az olduğu) alanlar ve hatta uygun sıralı formları destekleyen sonsuz boyutlu alanlar için geçerlidir.
Örnek kümesinde en az iki farklı x -değeri (yordayıcı) varsa , X T X'in tersinin var olduğunu göstermek (kendiniz için rastgele sayıda nokta için deneyin) kolaydır . Tüm veriler varsa sadece aynı değerler x i = x (yani, istiflenmiş noktaları y dikey bir çizgi boyunca, yönünde), daha sonra herhangi bir hattı, ortalama çekilen ¯ y , yani rasgele bir eğime (regresyon katsayısı) sahip olacak o zaman LSE regresyon hattının benzersiz olmadığını.
Tipik regresyonda, X sıskadır ve bu nedenle kesinlikle tersine çevrilemez (tersine çevrilebilir olsa da). X'in sıska ve tersine çevrilebilir olması durumunda X ^ T * X'in tersine çevrilebilir olduğunu kanıtlamak (yardıma ihtiyacınız olup olmadığını sormak) kolaydır. Bu durumda, o zaman tam olarak bir çözüm olacaktır. Ve eğer X tam sütun sıralamasına sahip değilse, X ^ T * X tam sıra olmayacaktır ve bu nedenle az belirlenmiş bir sisteminiz olacaktır.