Öyle hemen hemen her zaman gözlemleri kaldırmak için bir hile geliştirmek için bir regresyon modeli. Sadece gerçekte aykırı değerler olduğunu düşündüğünüzde gözlemleri bırakmalısınız.
Örneğin, akıllı saatinize bağlı kalp atış hızı monitörünüzden zaman serileri vardır. Diziye bakarsanız, 300bps gibi okumalarla hatalı gözlemlerin olacağını görmek kolaydır. Bunlar kaldırılmalıdır, ancak modeli geliştirmek istediğiniz için değil (ne anlama geliyorsa). Kalp atış hızınızla hiçbir ilgisi olmayan okuma hatalarıdır.
Dikkat edilmesi gereken bir şey, hataların verilerle ilişkilendirilmesidir. Örneğimde, atlama ve koşma gibi egzersizler sırasında kalp atış hızı monitörünün yerini değiştirdiğinde hatalarınız olduğu söylenebilir. Bu da bu hataları hart oranıyla ilişkilendirecektir. Bu durumda, bu aykırı değerlerin ve hataların kaldırılmasına dikkat edilmelidir, çünkü bunlar rastgele değildir
Aykırı değerlerin ne zaman kaldırılmayacağına dair bir örnek vereceğim . Diyelim ki bir yay üzerindeki ağırlığın hareketini ölçüyorsunuz. Ağırlık, ağırlığın gücüne göre küçükse , Hooke yasasının çok iyi çalıştığını göreceksiniz : burada F kuvvet, k - gerilme katsayısı ve Δ x ağırlığın konumudur .
F= - k Δ x ,
FkΔ x
Eğer çok fazla kilo çok ağır ağırlığını koydu ya yerinden Şimdi, eğer sen sapmaları görmeye başlarsınız: yeterince büyük yer değiştirmeler de hareketi doğrusal modele sapma gibi görünür. Bu nedenle, lineer modeli geliştirmek için aykırı değerleri kaldırmak cazip olabilir . Bu iyi bir fikir olmaz, çünkü Hooke yasası sadece yaklaşık olarak doğru olduğundan model çok iyi çalışmıyor.Δ x
GÜNCELLEME Sizin durumunuzda bu veri noktalarını çekmenizi ve onlara daha yakından bakmanızı öneririm. Laboratuar aleti hatası olabilir mi? Dış müdahale? Örnek hatası? vb.
Sonra, bu aykırı değerlerin sunumunun verdiğim örnekte ölçtüğünüz şeyle ilişkilendirilip ilişkilendirilemeyeceğini belirlemeye çalışın. Bir korelasyon varsa, o zaman bunun için basit bir yol yoktur. Herhangi bir korelasyon yoksa aykırı değerleri kaldırabilirsiniz