Bu formülün anlamı gerçekten oldukça basit. Görüntünün aynı boyutta iki küçük alanını, mavi olanı ve kırmızı olanı aldığınızı hayal edin:
Pencere işlevi, kırmızı dikdörtgenin dışında 0'a eşittir (basitlik için, pencerenin kırmızı dikdörtgen içinde sabit olduğunu varsayabiliriz). Böylece pencere işlevi hangi piksellere bakmak istediğinizi seçer ve her piksele göreceli ağırlıklar atar. (En yaygın olanı Gauss penceresidir, çünkü dönme açısından simetriktir, pencerenin merkezine yakın pikselleri hesaplamak ve vurgulamak etkilidir.) Mavi dikdörtgen (u, v) ile kaydırılır.
Daha sonra, kırmızı ve mavi ile işaretlenmiş görüntü bölümleri arasındaki kare farkının toplamını hesaplarsınız, yani pikselleri piksel olarak çıkarır, farkı kareler ve sonucu toplarsınız (varsayalım ki, baktığımız alandaki pencerenin = 1 olması ) de. Bu size her olası (u, v) -> E (u, v) için bir sayı verir.
Bunu u / v'nin farklı değerleri için hesaplarsak ne olacağını görelim:
İlk önce v = 0:
Bu sürpriz olmamalı: Görüntü parçaları arasındaki fark, aralarındaki uzaklık (u, v) 0 olduğunda en düşüktür. İki yama arasındaki mesafeyi artırdıkça, kare farklarının toplamı da artar.
U = 0 tutulması:
Çizim benzer, ancak mavi dikdörtgeni kenar yönünde kaydırdığınızda iki görüntü parçası arasındaki kare farkların toplamı çok daha küçük.
E (u, v) nin tam bir arsa şuna benzer:
Arsa, bir "kanyon" a benziyor: Görüntüyü kanyon yönünde kaydırırsanız, sadece küçük bir fark var. Çünkü bu görüntü yaması baskın (dikey) bir yönelime sahip.
Aynı şeyi farklı bir resim yaması için de yapabiliriz:
Burada, E (u, v) arsa farklı görünüyor:
Yamayı hangi yöne kaydırdığınızın önemi yoktur, her zaman farklı görünür.
Böylece, E (u, v) fonksiyonunun şekli bize görüntü yaması hakkında bir şeyler söyler.
- E (u, v) her yerde 0'a yakınsa, aradığınız görüntü yamasında hiçbir doku yoktur.
- E (u, v) "kanyon şeklindeyse", yama baskın bir yönelime sahiptir (bu bir kenar veya doku olabilir)
- E (u, v) "koni şeklinde" ise, yama dokuya sahiptir ancak baskın yönelim yoktur. Köşe detektörünün aradığı yama bu.
Birçok referans, 'w' penceresinin hangi büyüklükte değiştiğini söylüyor ... yani pencere ne kadar kaydırılmış? Bir piksel ... iki piksel?
Normalde, E (u, v) 'yi hiç hesaplamazsınız. Sadece (u, v) = (0,0) mahallesindeki şekli ile ilgileniyorsunuz. Demek ki Taylor'un (0,0) yakınındaki E (u, v) 'nin genişlemesini istiyoruz ki bu onun "şeklini" tamamen açıklar.
Piksel konumlarının toplamı pencere tarafından kapsanıyor mu?
Matematiksel olarak konuşursak, toplamanın tüm pikseller üzerinde değişmesine izin vermek daha zarif. Pratik olarak konuşursak, pencerenin 0 olduğu piksellerin toplanmasının bir anlamı yoktur.