Çoğu zaman istatistiksel bir analiste set veri kümesi verilir ve doğrusal regresyon gibi bir teknik kullanılarak bir modele uyması istenir. Veri setine sıklıkla "Ah evet, bu veri noktalarının bir kısmını topladık - yapabileceklerinizi yapın" gibi bir feragatname eşlik eder.
Bu durum hatalı veri olabilecek aykırı değerlerin varlığından büyük ölçüde etkilenen regresyon uyumlarına yol açmaktadır. Aşağıdakiler göz önüne alındığında:
Verileri, "formun kötü görünmesi" dışında bir sebep olmadan dışarı atmak hem bilimsel hem de ahlaki açıdan tehlikelidir.
Gerçek hayatta, verileri toplayan insanlar, "bu veri setini oluştururken, hangi noktalardan tam olarak kaçtınız?" Gibi soruları cevaplamak için sık sık müsait değillerdir.
Doğrusal regresyon analizinde aykırı değerleri dışlamak için temel olarak hangi istatistiksel testler veya kurallar kullanılabilir?
Çok satırlı regresyon için herhangi bir özel husus var mı?