Harris'in köşe noktası tespit matematiği


23

Bu Harris köşesi tespiti için matematiksel ifadedir:

Bu Harris köşesi tespiti için matematiksel ifadedir ...

Ancak aşağıdaki şüphelerim var:

  1. Fiziksel önemi nedir ve v ? Birçok referanslar o pencere hangi büyüklük olduğunu söylemek w kaymıştır. Peki, pencere ne kadar kaydırıldı? Bir piksel mi yoksa iki piksel mi?uvw
  2. Piksel konumlarının toplamı pencere tarafından kapsanıyor mu?
  3. Sadece varsayarsak , I ( x , y ) en tek pikselin şiddeti ( x , y ) ya da merkezi pencere içinde yoğunluklarının toplamı ( x , y ) ?w(x,y)=1I(x,y)(x,y)(x,y)
  4. Wiki'ye göre görüntünün 2B olduğunu söyler, I ile gösterilir ve sonra alanın üzerindeki görüntü yamasını düşünmeyi ister , sonra I ( x , y ) gösterimini kullanır.(x,y)I(x,y)

Matematiksel açıklamayı kavramak için kafa karıştırıcı buluyorum. Bir fikri olan var mı?


2
Harris'in köşe dedektöründeki bu dersi izleyin. Çok açık: youtube.com/watch?v=P35WsRDnTsU&t=41m12s

Kişisel blogumda yukarıdaki derse dayanan bir yazı yazdım. matlabcorner.wordpress.com/2012/11/17/…
Andrey Rubshtein

Yanıtlar:


31

Bu formülün anlamı gerçekten oldukça basit. Görüntünün aynı boyutta iki küçük alanını, mavi olanı ve kırmızı olanı aldığınızı hayal edin:

görüntü tanımını buraya girin

Pencere işlevi, kırmızı dikdörtgenin dışında 0'a eşittir (basitlik için, pencerenin kırmızı dikdörtgen içinde sabit olduğunu varsayabiliriz). Böylece pencere işlevi hangi piksellere bakmak istediğinizi seçer ve her piksele göreceli ağırlıklar atar. (En yaygın olanı Gauss penceresidir, çünkü dönme açısından simetriktir, pencerenin merkezine yakın pikselleri hesaplamak ve vurgulamak etkilidir.) Mavi dikdörtgen (u, v) ile kaydırılır.

Daha sonra, kırmızı ve mavi ile işaretlenmiş görüntü bölümleri arasındaki kare farkının toplamını hesaplarsınız, yani pikselleri piksel olarak çıkarır, farkı kareler ve sonucu toplarsınız (varsayalım ki, baktığımız alandaki pencerenin = 1 olması ) de. Bu size her olası (u, v) -> E (u, v) için bir sayı verir.

Bunu u / v'nin farklı değerleri için hesaplarsak ne olacağını görelim:

İlk önce v = 0:

görüntü tanımını buraya girin

Bu sürpriz olmamalı: Görüntü parçaları arasındaki fark, aralarındaki uzaklık (u, v) 0 olduğunda en düşüktür. İki yama arasındaki mesafeyi artırdıkça, kare farklarının toplamı da artar.

U = 0 tutulması:

görüntü tanımını buraya girin

Çizim benzer, ancak mavi dikdörtgeni kenar yönünde kaydırdığınızda iki görüntü parçası arasındaki kare farkların toplamı çok daha küçük.

E (u, v) nin tam bir arsa şuna benzer:

görüntü tanımını buraya girin

Arsa, bir "kanyon" a benziyor: Görüntüyü kanyon yönünde kaydırırsanız, sadece küçük bir fark var. Çünkü bu görüntü yaması baskın (dikey) bir yönelime sahip.

Aynı şeyi farklı bir resim yaması için de yapabiliriz:

görüntü tanımını buraya girin

Burada, E (u, v) arsa farklı görünüyor:

görüntü tanımını buraya girin

Yamayı hangi yöne kaydırdığınızın önemi yoktur, her zaman farklı görünür.

Böylece, E (u, v) fonksiyonunun şekli bize görüntü yaması hakkında bir şeyler söyler.

  • E (u, v) her yerde 0'a yakınsa, aradığınız görüntü yamasında hiçbir doku yoktur.
  • E (u, v) "kanyon şeklindeyse", yama baskın bir yönelime sahiptir (bu bir kenar veya doku olabilir)
  • E (u, v) "koni şeklinde" ise, yama dokuya sahiptir ancak baskın yönelim yoktur. Köşe detektörünün aradığı yama bu.

Birçok referans, 'w' penceresinin hangi büyüklükte değiştiğini söylüyor ... yani pencere ne kadar kaydırılmış? Bir piksel ... iki piksel?

Normalde, E (u, v) 'yi hiç hesaplamazsınız. Sadece (u, v) = (0,0) mahallesindeki şekli ile ilgileniyorsunuz. Demek ki Taylor'un (0,0) yakınındaki E (u, v) 'nin genişlemesini istiyoruz ki bu onun "şeklini" tamamen açıklar.

Piksel konumlarının toplamı pencere tarafından kapsanıyor mu?

Matematiksel olarak konuşursak, toplamanın tüm pikseller üzerinde değişmesine izin vermek daha zarif. Pratik olarak konuşursak, pencerenin 0 olduğu piksellerin toplanmasının bir anlamı yoktur.


bir ton Nikie teşekkür ederim ....
rotating_image

2
Burada mükemmel bir cevap alacağınızı biliyordum, @ rotating_image
karlphillip 11:12

thanx karlphillip ..
rotating_image

1
Bir milyon dolar!
Phonon
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.