Bazı verilere uygun herhangi bir regresyon çizgisini düşünün.
Şimdi fazladan bir veri noktası, verinin ana gövdesinden biraz uzakta, ama bu regresyon çizgisi boyunca bir yerde olan bir uzak nokta hayal edin.
Eğer regresyon çizgisi yeniden yerleştirilecek olsaydı, katsayılar değişmezdi. Tersine, ekstra aykırı değerlerin silinmesinin katsayılar üzerinde sıfır etkisi olacaktır.
Bu nedenle, bir aykırı değer veya kaldıraç noktasının, verilerin geri kalanıyla ve geri kalan modelle mükemmel şekilde tutarlı olması durumunda sıfır etkiye sahip olacaktır.
İsterseniz "çizgi" için "düzlem" veya "hiper düzlem" i okuyun, ancak iki değişkenin ve en basit dağılımın en basit örneği burada yeterlidir.
Bununla birlikte, tanımlara düşkün olduğunuz gibi - çoğu zaman, onlara çok fazla okuma eğilimi gösteriyor - işte benim aykırı değerlerin en sevdiğim tanımı:
"Aykırı değerler, numunenin çoğunluğu ile ilgili sürpriz oluşturan örnek değerleridir" (WN Venables ve BD Ripley. 2002. S. New York ile modern uygulamalı istatistikler : Springer, s.119).
En önemlisi, sürpriz seyircinin zihnindedir ve verilerin örtük veya açık bir modeline bağlıdır. Aykırı değerlerin hiç şaşırtıcı olmadığı başka bir model olabilir, örneğin verilerin normalden ziyade lognormal veya gama olup olmadığını söyleyin.
PS O kaldıraç noktaları sanmıyorum mutlaka komşu gözlemlerini yoksundur. Örneğin, çiftler halinde ortaya çıkabilirler.