Doğrusal regresyon modeli
Y= Xβ+ ϵ , buradaϵ ∼ N( 0 , benσ2)
Y∈Rn , veX∈Rn×pβ∈Rp
Model hatasının (artık) . Amacımız , bu hatanın alan normunu en aza indiren bir s vektörü .ϵ=Y−XββL2
En Küçük Kareler
Verilen veriler her yerde olan boyutlu, biz bulmak için aramak:(x1,y1),...,(xn,yn)xip
βˆLS=argminβ||ϵ||2=argminβ||Y−Xβ||2=argminβ∑i=1n(yi−xiβ)2
Maksimum Olabilirlik
Yukarıdaki modeli kullanarak parametreleri verilen verilerin olasılığını şu şekilde ayarlayabiliriz :β
L(Y|X,β)=∏i=1nf(yi|xi,β)
burada , ortalama 0 ve varyans olan normal dağılımın . Takılıyor:f(yi|xi,β)σ2
L(Y|X,β)=∏i=1n12πσ2−−−−√e−(yi−xiβ)22σ2
Şimdi genellikle olasılıklarla uğraşırken, devam etmeden önce günlüğü almak matematiksel olarak daha kolaydır (ürünler toplamlar olur, üsler kaybolur), bunu yapalım.
logL(Y|X,β)=∑i=1nlog(12πσ2−−−−√)−(yi−xiβ)22σ2
Maksimum olabilirlik tahmini istediğimizden, ile ilgili olarak yukarıdaki denklemin maksimumunu bulmak istiyoruz . İlk terim tahminimizi etkilemez , bu nedenle yok sayabiliriz:ββ
βˆMLE=argmaxβ∑i=1n−(yi−xiβ)22σ2
Paydanın açısından bir sabit olduğunu unutmayın . Son olarak, toplamın önünde olumsuz bir işaret olduğunu unutmayın. Negatif bir sayının maksimumu bulmak, negatif olmayan minimumu bulmak gibidir. Başka bir deyişle:β
βˆMLE=argminβ∑i=1n(yi−xiβ)2=βˆLS
Bunun işe yaraması için bazı model varsayımları yapmak zorunda olduğumuzu hatırlayın (hata terimlerinin normalliği, 0 ortalama, sabit varyans). Bu, belirli koşullar altında MLE'ye eşit en küçük kareler yapar. Daha fazla tartışma için buraya ve buraya bakın .
Tamlık için, çözümün şu şekilde yazılabileceğini unutmayın:
β=(XTX)−1XTy