En küçük kareler regresyon geometrik yorumu gerekli bilgiler sağlar.
Bilmemiz gerekenlerin çoğu, yanıtı olan iki ve görülebilir . Standardize katsayıları, her üç vektörler (biz birlik olmaya sürebilir) ortak bir uzunluğa standardize edildiğinde ya da "betalar," ortaya çıkar. Bu nedenle, ve bir düzlemde birim vektörlerdir --they birim çember üzerinde yer - ve , üç boyutlu bir Öklid alan bir birim vektör uçağa ihtiva etmektedir. Takılan değer , üzerine dik (dikey) projeksiyonudur . Çünküx1x2yx1x2E2yE3y^yE2R2sadece y'ın kare uzunluğu, üç boyutu bile görselleştirmemize gerek yok: İhtiyacımız olan tüm bilgiler bu düzlemde çizilebilir.y^
Dik regresörler
En güzel durum, ilk şekilde olduğu gibi regresörlerin dikey olması.
Bu ve diğer şekillerde birim diski sürekli olarak beyaza ve regresörleri siyah oklar olarak çizeceğim. her zaman doğrudan sağa işaret edecektir. Kalın kırmızı oklar bileşenlerini tasvir de ve gibidir: yönleri ve . Uzunluğu ama unutmayın - bu uzandığı gri dairenin yarıçapıdır olduğux1y^x1x2β1x1β2x2y^R2 kare bu uzunluktaki.
Pisagor Teoremi iddia
R2=|y^|2=|β1x1|2+|β2x2|2=β21(1)+β22(1)=β21+β22.
Pisagor Teoremi herhangi bir sayıda boyuta sahip olduğu için, bu akıl yürütme, herhangi bir sayıda regresöre genelleme yaparak ilk sonucumuzu verir:
Regresörler dikey olduğunda, betaların karelerinin toplamına eşittir.R2
Acil bir sonuç, sadece bir regresör - tek değişkenli regresyon olduğunda - standart eğimin karesidir.R2
korele
Negatif korelasyonlu regresörler dik açıdan daha büyük açılarda buluşur.
Bu görüntüde, betaların karelerinin toplamının kesinlikle daha büyük olduğu açıkça görülüyor. R2. Bu, Kosinüs Yasası kullanılarak veya Normal Denklemlerin matris çözümü ile çalışılarak cebirsel olarak kanıtlanabilir.
İki regressörü neredeyse paralel hale getirerek, y^ menşe yakın (bir R2 yakın 0) büyük bileşenlere sahip olmaya devam ederken, x1 ve x2Yön. Bu nedenle, ne kadar küçük olduğuna dair bir sınır yoktur.R2 olabilir.
Bu açık sonucu, ikinci genelliğimizi anlatalım:
Regresörler ilişkili olduğunda, R2 betaların karelerinin toplamından keyfi olarak daha küçük olabilir.
Bununla birlikte, bir sonraki rakamın gösterdiği gibi, bu evrensel bir ilişki değildir.
şimdi R2betaların karelerinin toplamını kesinlikle aşıyor. İki gerilimi birbirine yakın tutarak vey^ aralarında betaların her ikisine de yaklaşabiliriz 1/2, hatta R2 yakın 1. Daha fazla analiz biraz cebir gerektirebilir: Bunu aşağıda ele alıyorum.
Akut açılarda buluşan pozitif korelasyonlu regresörler ile benzer örnekler inşa etmeyi hayal gücünüze bırakıyorum.
Bu sonuçların eksik olduğuna dikkat edin: Ne kadar az R2betaların karelerinin toplamı ile karşılaştırılabilir. Özellikle, olasılıkları dikkatle inceleyerek, (iki regresörle gerileme için)
Regresörler pozitif korelasyon gösterdiğinde ve betaların ortak bir işareti olduğunda veya regresörler negatif korelasyonu olduğunda ve betaların farklı işaretleri olduğunda, R2 en azından betaların karelerinin toplamı kadar büyük olmalıdır.
Cebirsel sonuçlar
Genel olarak, regresörler olsun (sütun vektörleri) x1,x2,…,xp ve cevap y. Standartlaştırma araçları (a) her biri vektöre diktir(1,1,…,1)′ ve (b) birim uzunlukları varsa:
|xi|2=|y|2=1.
Sütun vektörlerini birleştirme xi Içine n×p matris X. Matris çarpımının kuralları,
Σ=X′X
korelasyon matrisi xi. Betalar Normal Denklemler tarafından verilir,
β=(X′X)−1X′y=Σ−1(X′y).
Dahası, tanım gereği, uyum
y^=Xβ=X(Σ−1X′y).
Kare uzunluğu verir R2 tanım olarak:
R2=|y^|2=y^′y^=(Xβ)′(Xβ)=β′(X′X)β=β′Σβ.
Geometrik analiz, ilgili eşitsizlikleri aramamızı önerdi. R2 ve betaların karelerinin toplamı,
∑i=1pβ2i=β′β.
L2 herhangi bir matrisin normu A katsayılarının karelerinin toplamı ile verilir (temel olarak matrisin bir vektörü olarak ele alınması p2 Öklid uzayındaki bileşenler),
|A|22=∑i,ja2ij=tr(A′A)=tr(AA′).
Cauchy-Schwarz Eşitsizliği,
R2=tr(R2)=tr(β′Σβ)=tr(Σββ′)≤|Σ|2|ββ′|2=|Σ|2β′β.
Kare korelasyon katsayıları geçilemediğinden 1 ve sadece p2 bunlardan p×p matris Σ, |Σ|2 Aşamaz 1×p2−−−−−√=p. bu nedenle
R2≤pβ′β.
Eşitsizlik, örneğin, xi mükemmel pozitif ilişkilidir.
Ne kadar büyük bir üst sınır var R2olabilir. Regresör başına ortalama değeri,R2/p, standart katsayıların karelerinin toplamını aşamaz.
Sonuçlar
Genel olarak ne sonuçlandırabiliriz? Açıkça, hakkındaki bilgiler korelasyon yapısı regresörler yanı sıra betalarının işaretleri olası değerlerini bağlı ya kullanılabilecekR2hatta tam olarak hesaplamak için. Tam bilgi olmadığında, regresörler doğrusal olarak bağımsız olduğunda, tek bir sıfır olmayan beta'nın ima ettiği gerçeğinin ötesinde çok az şey söylenebilir.y^ sıfırdan farklı, R2 sıfır değildir.
Sorudaki çıktıdan kesinlikle sonuca varabileceğimiz bir şey, verilerin ilişkili olduğudur: çünkü betaların karelerinin toplamı, 1.1301, mümkün olan maksimum değeri aşıyor R2 (yani 1), bazı korelasyonlar olmalıdır .
Başka bir şey, en büyük beta (boyut olarak) −0.83, karesi olan 0.69- rapor edilenin çok üzerinde R2 nın-nin 0.20- bazı regresörlerin negatif korelasyonlu olması gerektiği sonucuna varabiliriz . (Aslında,VO2max muhtemelen, geniş bir değer aralığını kapsayan herhangi bir örnekte yaş, ağırlık ve yağ ile güçlü bir şekilde negatif ilişkilidir.)
Sadece iki regresör olsaydı, R2 yüksek regresör korelasyonları ve betaların incelenmesi bilgisinden, çünkü bu nasıl yapılacağına dair doğru bir çizim yapmamızı sağlayacaktır. x1, x2, ve y^yerleştirilmelidir. Ne yazık ki, bu altı değişkenli problemdeki ek regresörler işleri önemli ölçüde karmaşıklaştırmaktadır. Değişkenlerden herhangi ikisini analiz ederken, diğer dört regresörü ("ortak değişkenler") "çıkarmamız" veya "kontrol etmemiz" gerekir. Böylece,x1, x2, ve ybilinmeyen miktarlarda (bunların üçünün ortak değişkenlerle nasıl ilişkili olduğuna bağlı olarak), birlikte çalıştığımız vektörlerin gerçek boyutları hakkında neredeyse hiçbir şey bilmemize izin verir .