Sorunu rutin prosedürlerle basitleştirdikten sonra, temel bir kanıtla iyi bilinen bir cevabı olan çift minimizasyon programına dönüştürülerek çözülebilir. Belki de bu dualizasyon, soruda değinilen "ince adım" dır. Eşitsizlik aynı zamanda maksimuma çıkarılarak tamamen mekanik bir şekilde de belirlenebilir.|Ti| Lagrange çarpanları aracılığıyla .
İlk olarak, en küçük karelerin geometrisine dayanan daha zarif bir çözüm sunuyorum. Ön basitleştirme gerektirmez ve sonuca doğrudan sezgi sağlayarak neredeyse anında gerçekleşir. Soruda önerildiği gibi, sorun Cauchy-Schwarz eşitsizliğine azalmaktadır.
Geometrik çözüm
Düşünmek x =(X1,X2, … ,Xn) olarak nuzay ürünü ile Öklid uzayında üç boyutlu vektör. İzin Vermeky =(0,0,…,0,1,0,…,0) ol beninci temel vektör ve 1 =(1,1,…,1). Yazmakx^ ve y^ dik çıkıntıları için x ve y dikey olarak 1. (İstatistiksel terminolojide, araçlar bakımından artıklardır.) O zamandan beriXben-X¯=x^⋅ y ve S= | |x^| | /n - 1-----√,
|Tben| =n - 1-----√|x^⋅ y || |x^| |=n - 1-----√|x^⋅y^|| |x^| |
bileşeni y^ içinde x^Yön. Cauchy-Schwarz tarafından, tam olarak ne zaman maksimize edilirx^ paralel y^= ( - 1 , - 1 , … , - 1 , n - 1 , - 1 , - 1 , … , - 1 ) / n, hangisi için
Tben=±n−1−−−−−√y^⋅y^||y^||=±n−1−−−−−√||y^||=±n−1n−−√,
QED.
Bu arada, bu çözüm tüm vakaların kapsamlı bir karakterizasyonunu sağlar. |Ti| en üst düzeye çıkarılır: hepsi formda
x=σy^+μ1=σ(−1,−1,…,−1,n−1,−1,−1,…,−1)+μ(1,1,…,1)
herkes için μ , σ.
Bu analiz, { 1 }yerine herhangi bir regresör grubu konulur. Açıkçası maksimumTben kalıntısının uzunluğu ile orantılıdır. y, | |y^| |.
sadeleştirme
Çünkü Tben konum ve ölçek değişiklikleri altında değişmezse, genel bir kayıp olmadan Xben toplamı sıfıra ve kareleri toplamı n - 1. Bu,|Tben| ile |Xben|, dan beri S (ortalama kare) 1. En üst düzeye çıkarmak, en üst düzeye çıkarmak ile eşdeğerdir|Tben|2=T2ben=X2ben. Alarak hiçbir genellik kaybolmazi = 1, ya, Xben değiştirilebilir.
Çözüm aracılığıyla ikili formülasyonu
İkili bir sorun, X21 ve kalan değerlerin ne olduğunu sorun Xj, j ≠ 1karelerin toplamını en aza indirmek için gereklidirΣnj = 1X2j verilen Σnj = 1Xj= 0. ÇünküX1 verilir, bu minimize etme problemidir Σnj = 2X2j verilen Σnj = 2Xj= -X1.
Çözüm birçok yönden kolayca bulunur. En temellerden biri yazmak
Xj= -X1n - 1+εj, j = 2 , 3 , … , n
hangisi için Σnj = 2εj= 0. Amaç fonksiyonunu genişletmek ve ürettiği sadeleştirmek için bu toplam-sıfır kimliğini kullanmak
Σj = 2nX2j=Σj = 2n( -X1n - 1+εj)2=Σ( -X1n - 1)2- 2X1n - 1Σεj+ ∑ε2j= Sabit + ∑ε2j,
anında benzersiz çözümü gösteren εj= 0 hepsi için j. Bu çözüm için,
( n - 1 )S2=X21+ ( n - 1 )( -X1n - 1)2= ( 1 +1n - 1)X21=nn - 1X21
ve
|Tben| =|X1|S=|X1|n( n - 1)2X21-------√=n - 1n--√,
QED .
Çözüm yolu ile makina
Başladığımız basitleştirilmiş programa geri dönün:
Üst Düzeye X21
tabi
Σi = 1nXben= 0 ve Σi = 1nX2ben- ( n - 1 ) = 0.
Lagrange çarpanları yöntemi (neredeyse tamamen mekanik ve basittir), bu üç fonksiyonun gradyanlarının önemsiz doğrusal bir kombinasyonunu sıfıra eşitler:
( 0 , 0 , … , 0 ) =λ1D (X21) +λ2D (Σi = 1nXben) +λ3D (Σi = 1nX2ben- ( n - 1 ) ) .
Bileşene göre bileşen, bunlar n denklemler
0000= 2λ1X1+== ⋯=λ2λ2λ2+ 2λ3X1+ 2λ3X2+ 2λ3Xn.
Son n - 1 bunların ikisi de X2=X3= ⋯ =Xn= -λ2/ (2λ3) veya λ2=λ3= 0. (İkinci durumu dışlayabiliriz çünkü ilk denklemλ1= 0, doğrusal kombinasyonu önemsizleştiriyor.) Toplam-sıfır arasındaki sınırlama X1= - ( n - 1 )X2. Kareler toplamı kısıtlaması iki çözüm sağlar
X1= ±n - 1n--√; X2=X3= ⋯ =Xn= ∓1n--√.
İkisi de verim veriyor
|Tben| = |X1| ≤ | ±n - 1n--√| =n - 1n--√.