Önceden yayınlanan cevaplara ek olarak (bana çok yardımcı oldu!), L2 normu ile ortalama arasındaki bağlantıya dair geometrik bir açıklama var.
Chefwen ile aynı notasyonu kullanmak için , L2 kaybının formülü:
L 2 = 1kΣi = 1k( yben- β)2
Değerini bulmak istiyoruz β hangi en aza indirir L 2. Bunun, aşağıdakileri minimize etmeye eşdeğer olduğuna dikkat edin;k ve karekök alarak her ikisi de sırayı korur:
Σi = 1k( yben- β)2----------⎷
Veri vektörünü dikkate alırsanız y bir nokta olarak kboyutlu uzay, bu formül nokta arasındaki Öklid mesafesini hesaplar y ve nokta β⃗ = ( β, β, . . . , β).
Yani sorun değeri bulmak β Bu, noktalar arasındaki Öklid mesafesini en aza indirir y ve β⃗ . Olası değerlerden beriβ⃗ hepsi paralel hat üzerinde yatıyor 1⃗ = ( 1 , 1 , . . . , 1 ) tanım gereği, bu vektör projeksiyonunu bulmakla eşdeğerdir y üstüne 1⃗ .
Bunu sadece görselleştirmek gerçekten mümkün k = 2, ama burada bir örnek y= ( 2 , 6 ). Gösterildiği gibi üzerine yansıtılıyor1⃗ verim ( 4 , 4 ) Beklediğimiz gibi.
Bu projeksiyonun her zaman ortalamayı verdiğini göstermek için (ne zaman k > 2), projeksiyon için formülü uygulayabiliriz :
β⃗ β= proj1⃗ y= y⋅ 1⃗ | 1⃗ |21⃗ = ∑ki = 1ybenk