Ortalama en aza indirir karesel hata (veya L2 normu, bkz burada ya burada ), ortalamadan tedbir mesafeye varyans için çok doğal seçim (bkz karesel hata kullanmaktır burada biz karesini neden). Diğer taraftan, medyan mutlak hatayı (L1 normu) en aza indirir, yani verilerinizin "ortasında" olan bir değerdir, bu yüzden medyandan ( Medyan Mutlak Sapma veya MAD olarak adlandırılır) mutlak mesafe bir medyan çevresindeki değişkenlik derecesinin daha iyi ölçülmesi. Bu ileti dizisinde bu ilişkiler hakkında daha fazla bilgi bulabilirsiniz .
Kısaca söylemek gerekirse, varyans MAD'ten verilerinizin merkezi noktasını nasıl tanımladıklarından farklıdır ve bu, etrafındaki veri noktalarının varyasyonunu nasıl ölçtüğümüzü etkiler. Değerlerin karesini almak aykırı değerlerin merkezi nokta (ortalama) üzerinde daha büyük etkiye sahip olmasını sağlarken, medyan durumunda tüm noktalar aynı etkiye sahiptir, bu nedenle mutlak mesafe daha uygun görünür.
Bu basit simülasyon ile de gösterilebilir. Ortalama ve medyandan kareleri alınmış değerleri karşılaştırırsanız, toplam kare mesafesi ortalamadan medyandan neredeyse her zaman daha küçüktür. Öte yandan, toplam mutlak mesafe ortancadan sonra ortalamadan daha küçüktür. Simülasyonu gerçekleştirmek için R kodu aşağıda belirtilmiştir.
sqtest <- function(x) sum((x-mean(x))^2) < sum((x-median(x))^2)
abstest <- function(x) sum(abs(x-mean(x))) > sum(abs(x-median(x)))
mean(replicate(1000, sqtest(rnorm(1000))))
mean(replicate(1000, abstest(rnorm(1000))))
mean(replicate(1000, sqtest(rexp(1000))))
mean(replicate(1000, abstest(rexp(1000))))
mean(replicate(1000, sqtest(runif(1000))))
mean(replicate(1000, abstest(runif(1000))))
Böyle bir "varyansı" tahmin etmede ortalama yerine medyan kullanılması durumunda bu, geleneksel olarak yapıldığı gibi ortalama kullanmaktan daha yüksek tahminlere yol açacaktır.
Bu arada, L1 ve L2 normlarının ilişkileri bu konudaki gibi Bayes bağlamında da düşünülebilir .