İnterpolasyonun istatistiksel gerekçesi nedir?


16

Varsayalım ki iki noktamız var (aşağıdaki şekil: siyah daireler) ve aralarındaki üçüncü nokta için bir değer bulmak istiyoruz (çapraz). Gerçekten de bunu deneysel sonuçlarımız olan siyah noktalara dayanarak tahmin edeceğiz. En basit durum bir çizgi çizmek ve sonra değeri bulmaktır (yani, doğrusal enterpolasyon). Her iki tarafta kahverengi noktalar olarak destek noktalarımız olsaydı, onlardan faydalanmayı ve doğrusal olmayan bir eğriye (yeşil eğri) uymayı tercih ederiz.

Soru şu ki, kırmızı haçı çözüm olarak işaretlemek için istatistiksel mantık nedir? Neden diğer haçlar (örneğin, sarı haçlar) nerede olabilecekleri cevap değildir? Ne tür bir çıkarım ya da (?) Bizi kırmızı olanı kabul etmeye itiyor?

Orijinal sorumu bu çok basit sorunun cevabına göre geliştireceğim.

resim açıklamasını buraya girin


7
Bu çok iyi pozlanmış ve ilginç bir soru. Zaman serilerinin içsel yönlülüğü nedeniyle zaman serileri enterpolasyonu ve diğer enterpolasyon formları (splining veya uzamsal enterpolasyon gibi) arasında ayrım yapmak isteyebilirsiniz.
whuber

1
Takdirim bu çok motivasyonel yoruma gidiyor.
Geliştirici

Yanıtlar:


14

Herhangi bir işlev uydurma biçimi, hatta parametrik olmayanlar (genellikle ilgili eğrinin düzgünlüğü hakkında varsayımlar yapan), varsayımlar ve dolayısıyla bir inanç sıçraması içerir.

Eski lineer enterpolasyonun eski çözümü, sahip olduğunuz veriler yeterince 'ince' olduğunda (sadece yeterince yakın bir daireye bakarsanız, düz görünür - sadece Columbus'a sorun) ve hatta mümkün olduğunda 'işe yarayan' çözümdür. bilgisayar çağından önce (birçok modern spline çözümü için durum böyle değil). İşlevin iki nokta arasında 'aynı (yani doğrusal) maddede devam edeceği' inancını varsaymak mantıklıdır, ancak bunun için önceden bir neden yoktur (eldeki kavramlar hakkında bilgi kısıtlaması).

Üç (veya daha fazla) doğrusal olmayan noktanız olduğunda (yukarıdaki kahverengi noktaları eklediğinizde olduğu gibi), her biri arasındaki doğrusal enterpolasyonun kısa bir süre içinde tipik olarak istenmeyen olan keskin köşeleri içereceği hemen anlaşılır. Diğer seçenekler burada devreye giriyor.

Bununla birlikte, daha fazla alan bilgisi olmadan, bir çözümün diğerinden daha iyi olduğunu kesin olarak belirtmenin bir yolu yoktur (bunun için , diğer noktaların değerinin ne olduğunu bilmek zorunda kalacaksınız . ilk yer).

Parlak tarafta ve belki de sorunuzla daha ilgili olan, 'düzenlilik koşulları' altında (okuma: varsayımlar : işlevin örneğin pürüzsüz olduğunu biliyorsanız ), hem doğrusal enterpolasyonun hem de diğer popüler çözümlerin 'makul' olduğu kanıtlanabilir. yaklaşımları. Yine de: varsayımlar gerektirir ve bunlar için tipik olarak istatistiklerimiz yoktur.


Bu iyi bir cevap ve cevap olarak işaretlenmeye adayım. Böyle ortak bir seçim için istatistiksel bir gerekçe olmadığını anladım, değil mi?
Geliştirici

Gerçekten inanmıyorum, biri yok, hayır.
Nick Sabbe

2
Bazı literatür (iyi bilinen veri kümelerinin örneklerini enterpolasyona yönelik yarışmalar dahil) bu yanıtı kısmen doğrular, ancak tamamen doğrulamaz. Herhangi bir "düzenlilik koşulu" olmadan, sadece verilerin istatistiksel analizi yoluyla verilerin mekansal korelasyonu hakkında çok şey öğrenilebilir. Gerekli olan şey, (1) ergodik bir hipotez ve (çoğu durumda) (2) bir tür durağanlık varsayımı ile birlikte, stokastik bir sürecin bir gerçekleşmesinin bir örneği olarak verilerin bir modelidir. Bu çerçevede enterpolasyon bir beklenti tahmini haline gelir, ancak ayrıştırılamayan eğrilere bile izin verilir.
whuber

1
@whuber: Buradaki rahatlık alanımdan çıkıyorum, ancak yorumunuzdaki "düzenlilik koşulları" ndan sonraki her şey oldukça sağlam bir varsayım gibi görünüyor (durağanlık bir düzenlilik koşulu anlamına gelir, hayır?). Aslında, örneklem boyutunuzun işlevsel formdaki düzensizliklere göre büyük olup olmadığına bağlı olacağını düşünüyorum ... Durumun olmadığı durumlarda bir kağıt veya benzeri bir referans verebilir misiniz?
Nick Sabbe

2
Varsayım olmadan hiçbir şey yapamazsınız Nick! Ancak düzenlilik (işlevin düzgünlüğü gibi) gerekli değildir: verilerden, en azından işlevin örneklendiği ölçekte çıkarılabilir . (Durağanlık pürüzsüzlükten çok daha hafif bir varsayımdır.) Büyük örneklere ihtiyaç duyduğunuz doğrudur, ancak 30-50 iyi seçilmiş örnek konumlarında bile 2B'de çok şey öğrenilebilir. Literatür büyük; örneğin, Matematiksel Jeoloji konularının çoğu buna ayrılmıştır. Titiz bir giriş için bkz. Cressie'nin Mekansal İstatistikleri.
whuber

0

En uygun çizgi için doğrusal denklemi çalıştırabilirsiniz (örn. Y = 0.4554x + 0.7525), ancak bu yalnızca etiketlenmiş bir eksen olsaydı işe yarardı. Ancak bu size sadece diğer noktalara göre en uygun cevabı vermeyecektir.


Ancak regresyon enterpolasyon değildir .
Scortchi - Monica'yı eski durumuna döndürün

1
@Scortchi Regresyonun enterpolasyon olarak anlaşılabileceğine inanıyorum. Bununla birlikte, regresyonun bir çözüm olarak önerilmesi, herhangi bir enterpolasyonun neden haklı olduğunu açıklamamızı isteyen (ve bizi haklı olarak gerekçelendirmek için gerekli varsayımları açıklamaya davet eden) soruyu cevaplamaz .
whuber

@whuber: Teşekkürler. İnterpolasyonu en azından prototip olarak en azından noktalara katılma olarak düşünüyordum - stats.stackexchange.com/a/33662/17230 .
Scortchi - Monica'yı eski durumuna döndürün

@Scortchi Bu iş parçacığı, esas olarak bir tablodaki matematiksel enterpolasyon kavramına yöneliktir . Sorusuna bir yorumda , enterpolasyonun geleneksel istatistiksel anlayışına dikkat çektim , ki bu oldukça farklı. Regresyon her iki dünyada da çalışır: bir regresyon fonksiyonu, bir matematiksel enterpolatör (bir tabloda örneklenmiş iyi tanımlanmış bir fonksiyon için) ve bir istatistiksel enterpolatör (bir bu işlemden elde edilen sonlu değer sayısı).
whuber

1
nn
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.