Ekstrapolasyon v. İnterpolasyon


28

Ekstrapolasyon ve enterpolasyon arasındaki fark nedir ve bu terimleri kullanmanın en kesin yolu nedir?

Örneğin, enterpolasyonu kullanarak bir gazetede bir ifade gördüm:

"İşlem, bölme noktaları arasındaki tahmini işlevin şeklini araya sokuyor"

Hem ekstrapolasyon hem de enterpolasyon kullanan bir cümle, örneğin:

Kernel yöntemini kullanarak enterpolasyonlu işlevi sol ve sağ sıcaklık kuyruklarına ekstrapoze ettiğimiz önceki adım.

Birisi, onları ayırt etmenin ve bu terimlerin bir örnekle doğru şekilde nasıl kullanılacağına rehberlik etmenin açık ve kolay bir yolunu sunabilir mi?




@ usεr11852 İki sorunun da benzer bir temeli kapsadığını, ancak bunun farklı olduğunu çünkü bunun interpolasyon ile kontrastı istediğini düşünüyorum.
mkt - Reinstate Monica,

İnterpolasyon ve ekstrapolasyon arasındaki bu ayrım, genel olarak kararlaştırılmış bir şekilde (örneğin, dışbükey gövdeler yoluyla) titizlikle resmileştirildi mi, yoksa bu terimler hala insani yargılamaya ve yorumlamaya mı tabi?
Nick Alger,

Yanıtlar:


51

Buna görsel bir açıklama eklemek için: Modellemeyi planladığınız birkaç noktayı düşünelim.

görüntü tanımını buraya girin

Düz bir çizgiyle iyi tanımlanmış gibi görünüyorlar, bu nedenle onlara doğrusal bir gerileme uyuyorsunuz:

görüntü tanımını buraya girin

Bu regresyon çizgisi hem enterpolasyon yapmanıza (veri noktalarınız arasında beklenen değerleri üretmenize) hem de ekstrapolate (veri noktalarınızın aralığı dışında beklenen değerler üretmenize) izin verir. Kırmızıdaki ekstrapolasyonu ve mavi olan en büyük enterpolasyon bölgesini vurguladım. Açık olmak gerekirse, noktalar arasındaki minik bölgeler bile enterpolasyonludur, ama ben sadece büyük olanı vurgularım.

görüntü tanımını buraya girin

Neden ekstrapolasyon daha fazla endişe vericidir? Çünkü, verilerinizin kapsamı dışındaki ilişkinin şekli konusunda genellikle daha az emin olursunuz. Birkaç veri noktası topladığınızda neler olabileceğini göz önünde bulundurun (içi boş daireler):

görüntü tanımını buraya girin

Sonuçta bu ilişkinin sizin varsayımsal ilişkinizle iyi yakalanmadığı ortaya çıktı. Tahmini olmayan bölgedeki tahminler çok yolunda. Doğrusal olmayan bu ilişkiyi doğru tanımlayan kesin işlevi doğru tahmin etmiş olsanız bile, verileriniz doğrusal olmayanlığı iyi bir şekilde yakalayabilmeniz için yeterli bir aralığa yayılmadı, bu yüzden hala çok uzakta olabilirsiniz. Bunun yalnızca doğrusal regresyon için değil, aynı zamanda herhangi bir ilişki için de bir sorun olduğunu unutmayın - bu nedenle dış değer bulma tehlikeli olarak kabul edilir.

İnterpolasyon yapılan bölgedeki tahminler aynı zamanda uyum içindeki doğrusallık eksikliği nedeniyle de yanlıştır, ancak tahmin hataları çok daha düşüktür. Puanlarınız arasında (yani enterpolasyon bölgesi) beklenmedik bir ilişkinizin olmayacağının garantisi yoktur, ancak genellikle daha az olasıdır.


Ekstrapolasyonun her zaman korkunç bir fikir olmadığını ekleyeceğim - verilerinizin aralığının dışında küçük bir değeri tahmin ederseniz, muhtemelen çok yanlış olmayacaksınız (mümkün olsa da!). Dünyanın iyi bir bilimsel modeline sahip olmayan eskiler, güneşin ertesi gün ve ondan sonraki gün tekrar doğacağını tahmin etselerdi çok yanlış olmazlardı (bir gün geleceğe rağmen, bu bile başarısız olur).

2

Yorumlara göre düzenleyin: enterpolasyon veya ekstrapolasyon, beklentileri temel almak için bazı teorilere sahip olmak her zaman en iyisidir. Teori içermeyen modelleme yapılması gerekiyorsa , enterpolasyondan kaynaklanan risk genellikle ekstrapolasyondan daha azdır. Bununla birlikte, veri noktaları arasındaki boşluk büyük oranda arttıkça, enterpolasyon da riskli ve daha fazla risk altında kalmaktadır.


5
Cevabınızı beğendim ve benim için tamamlayıcı olarak ve hiçbir şekilde rekabet etmediğini düşünüyorum. Ancak, bazı okuyucular için önemli olan küçük bir nokta, kırmızı ve yeşilin, birkaç kişi için görsel olarak ayırt etmesi zor olmasıdır.
Nick Cox

1
@NickCox İyi bir nokta, bunu arttırdığınız için teşekkürler - Şimdi renk şemasını değiştirdim.
mkt - Reinstate Monica,

1
@leftaroundabout Benim açımdan Keeling eğrisi, ekonomi ve fiziği görmezden gelen ekstrapolasyonların yıllarca birkaç on yıl boyunca hala makul bir şekilde kesin olacağı yönündeydi. Kesin olarak 'son birkaç on yılı' not aldım çünkü yüksek çözünürlüklü ölçümler yaptığımız zaman ölçeği. Bu ekstrapolasyon edecek bir örnektir değil sen kötü yanlış yol açmış ve ben yetmeyecek belirterek düşünüyorum. Bu cevabın teorisiz ekstrapolasyonu desteklediğini iddia etmenin yanlış okunması gerektiğini düşünüyorum .
mkt - Reinstate Monica

1
Buna bağlı olarak, Taleb'in bu "türkiye örneğini" bu ekstrapolasyon kullanan insanlar için bir uyarı olarak verdim .
JM bir istatistikçi değil

1
Ekstrapolasyon, çok fazla uydurma yaparken özellikle sorunludur; Örneğin, bir polinom modelinde, veri setinin dışına çıkılması, en yüksek dereceli terimin patlamasıyla sonuçlanacaktır.
Toplama

21

Temelde enterpolasyon , veri desteği içindeki veya mevcut bilinen veri noktaları arasındaki bir işlemdir ; ekstrapolasyon olan veri desteği ötesinde . Aksi taktirde, ölçüt şudur: eksik değerler nerede?

Ayrımın bir nedeni, fazla değerlemenin pratikte yapılmadığı takdirde istatistiksel olarak iyi yapmanın daha zor ve hatta tehlikeli olduğudur. Bu her zaman doğru değildir: örneğin, nehir suları ölçülen kayıtta bir delik açarak, deşarj ölçümünü veya hatta aşamayı (dikey seviye) zorlayabilir. Bu gibi durumlarda, deşarj veya aşamada enterpolasyon yapmak da zordur ve veri desteği içinde olmak pek yardımcı olmaz.

Uzun vadede, niteliksel değişim genellikle niceliksel değişimin yerini alır. 1900'lerde, atlı trafikteki büyümenin şehirleri çoğunlukla istenmeyen dışkılarla yıkatacağı endişesi vardı. Dışkıdaki üstel içten yanmalı motor ve farklı üstellerin yerini almıştır.

Bir eğilim bir eğilimdir bir eğilimdir,
fakat soru şu, bükülecek mi?
Rotasını değiştirecek mi
Öngörülemeyen bir güçle
Ve erken sona erecek mi?

- Alexander Cairncross

Cairncross, A. 1969. Ekonomik tahminler. Ekonomi Dergisi , 79: 797-812. doi: 10.2307 / 2229792 ( s.797'de alıntı)


1
İyi cevap. Yorum tam orada - enterpolasyon = içini yumuşatmak, dışpolasyon = ötesini yumuşatmak adına.
Nükleer Wang

1
IMO bu doğru cevap. “Veri desteği” çok önemlidir; Gitmek istediğiniz nokta ölçülen iki nokta arasında olsa bile, veri desteğinin dışında kalabilir. Örneğin, Roma dönemindeki ve modern günden insanlar için refah verileriniz varsa, ancak bunlar arasında değilse, orta çağlara enterpolasyon yapmak çok problemli olacaktır. Buna ekstrapolasyon diyeceğim. OTOH, verileriniz seyrek dağılmış ancak tüm zaman dilimi boyunca eşit bir şekilde dağılmışsa, belirli bir yıla enterpolasyon yapmak çok daha mantıklıdır.
leftaroundabout

1
@leftaroundabout Sırf enterpolasyonun, verilerdeki çok büyük bir boşluk üzerinden yapılabilmesi, dışlama yapmaz. Prosedürün kendisinin prosedürünü uygunluğuyla karıştırıyorsunuz. Bazen enterpolasyon da kötü bir fikirdir.
mkt - Reinstate Monica,

1
@mkt: Onun ilk örnek olduğunu leftaroundabout ile tarafa gidiyorum olabilir extrapolasyon vs enterpolasyon gerçekten de biz düşünmek isteyebilirsiniz olarak tanımlanan olmadığı için, ekstrapolasyon düşünülebilir. Değişkenlerin basit bir dönüşümü enterpolasyonu ekstrapolasyona dönüştürebilir. Örneğinde, ham zaman yerine uzaklık fonksiyonları gibi bir şey kullanmak, ham zaman içinde enterpolasyon yaparken, mesafelerde ekstrapolasyon yaptığımız ve ham zamanları kullanmanın muhtemelen kötü bir fikir olacağı anlamına gelir.
Cliff AB

1
Bu benim cevabım. Bunu nitelendirme gereği duymuyorum. İnterpolasyon ile ekstrapolasyon arasındaki geniş bir ayrım, hangisinin yapıldığına karar vermenin biraz zor olduğunu dışlamaz. Veri alanının ortasında büyük bir delik varsa, etiketleme her iki şekilde de yapılabilir. Bazı pürüzlerin belirttiği gibi, günün sonunda ve gecenin başlangıcının birbirine bulanıklaştığı gerçeği gündüz ve gece arasındaki farkı anlamsız ya da yararsız yapmaz.
Nick Cox,

12

TL; DR versiyonu:

  • Inter polation mevcut veri noktaları arasında gerçekleşir.
  • Ekstra polation onların ötesinde gerçekleşir.

Anımsatıcı: in terpolation => içinde yan.

FWIW: önek arası arasındaki araçlar ve ötesinde ekstra- araçlar . Ayrıca düşünün arası devletler veya arasında gidip devlet karayolları ekstra gezegenimizin ötesinden Terrestrials.


1

Örnek:

Çalışma: 6-15 yaş arası kız çocuklarının yaşlarına göre basit bir doğrusal regresyon yerleştirmek istiyor. Örneklem büyüklüğü 100, yaş (hesaplama tarihi - doğum tarihi) /365.25 ile hesaplanır.

Veri toplandıktan sonra, model uygundur ve b0 kesişimi ve b1 eğrisinin tahminini alır. bu E (boy | yaş) = b0 + b1 * yaş anlamına gelir.

13 yaş için ortalama yüksekliği istediğinizde, 100 kız örneğinizde 13 yaşında bir kız olmadığını, bunlardan birinin 12.83 yaşında olduğunu ve bir tanesinin 13.24 olduğunu buldunuz.

Şimdi yaş = 13'ü E formülüne (yükseklik | yaş) = b0 + b1 * yaşına bağlarsınız. Buna enterpolasyon denir, çünkü 13 yaşında, modele uymak için kullanılan verilerinizin kapsamı kapsamındadır.

Eğer 30 yaş için ortalama boy almak ve bu formülü kullanmak istiyorsanız, buna ekstrapolasyon denir, çünkü yaş 30, verilerinizin kapsadığı yaş aralığının dışındadır.

Modelin çeşitli değişkenleri varsa, dikkatli olmanız gerekir çünkü kapsanan verilerin sınırlarını çizmek zordur.

İstatistiklerde, ekstrapolasyonu savunmuyoruz.


"In statistics, we do not advocate extrapolation." A major fraction of time series analysis does precisely that....
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.