Buna görsel bir açıklama eklemek için: Modellemeyi planladığınız birkaç noktayı düşünelim.
Düz bir çizgiyle iyi tanımlanmış gibi görünüyorlar, bu nedenle onlara doğrusal bir gerileme uyuyorsunuz:
Bu regresyon çizgisi hem enterpolasyon yapmanıza (veri noktalarınız arasında beklenen değerleri üretmenize) hem de ekstrapolate (veri noktalarınızın aralığı dışında beklenen değerler üretmenize) izin verir. Kırmızıdaki ekstrapolasyonu ve mavi olan en büyük enterpolasyon bölgesini vurguladım. Açık olmak gerekirse, noktalar arasındaki minik bölgeler bile enterpolasyonludur, ama ben sadece büyük olanı vurgularım.
Neden ekstrapolasyon daha fazla endişe vericidir? Çünkü, verilerinizin kapsamı dışındaki ilişkinin şekli konusunda genellikle daha az emin olursunuz. Birkaç veri noktası topladığınızda neler olabileceğini göz önünde bulundurun (içi boş daireler):
Sonuçta bu ilişkinin sizin varsayımsal ilişkinizle iyi yakalanmadığı ortaya çıktı. Tahmini olmayan bölgedeki tahminler çok yolunda. Doğrusal olmayan bu ilişkiyi doğru tanımlayan kesin işlevi doğru tahmin etmiş olsanız bile, verileriniz doğrusal olmayanlığı iyi bir şekilde yakalayabilmeniz için yeterli bir aralığa yayılmadı, bu yüzden hala çok uzakta olabilirsiniz. Bunun yalnızca doğrusal regresyon için değil, aynı zamanda herhangi bir ilişki için de bir sorun olduğunu unutmayın - bu nedenle dış değer bulma tehlikeli olarak kabul edilir.
İnterpolasyon yapılan bölgedeki tahminler aynı zamanda uyum içindeki doğrusallık eksikliği nedeniyle de yanlıştır, ancak tahmin hataları çok daha düşüktür. Puanlarınız arasında (yani enterpolasyon bölgesi) beklenmedik bir ilişkinizin olmayacağının garantisi yoktur, ancak genellikle daha az olasıdır.
Ekstrapolasyonun her zaman korkunç bir fikir olmadığını ekleyeceğim - verilerinizin aralığının dışında küçük bir değeri tahmin ederseniz, muhtemelen çok yanlış olmayacaksınız (mümkün olsa da!). Dünyanın iyi bir bilimsel modeline sahip olmayan eskiler, güneşin ertesi gün ve ondan sonraki gün tekrar doğacağını tahmin etselerdi çok yanlış olmazlardı (bir gün geleceğe rağmen, bu bile başarısız olur).
2
Yorumlara göre düzenleyin: enterpolasyon veya ekstrapolasyon, beklentileri temel almak için bazı teorilere sahip olmak her zaman en iyisidir. Teori içermeyen modelleme yapılması gerekiyorsa , enterpolasyondan kaynaklanan risk genellikle ekstrapolasyondan daha azdır. Bununla birlikte, veri noktaları arasındaki boşluk büyük oranda arttıkça, enterpolasyon da riskli ve daha fazla risk altında kalmaktadır.