Bilgisayar vizyonu için bazı standart teknikleri (Gauss Bulanıklığı, eşikleme, Hough-Transform vb.) Kullanarak statik bir görüntüdeki (.jpeg, .png vb.) Madeni paraları algılayan bir bilgisayar programı yazdım. Belirli bir görüntüden toplanan sikkelerin oranlarını kullanarak, hangi sikkelerin hangisi olduğuna kesin olarak karar verebilirim. Bununla birlikte, güven düzeylerime eklemek ve ayrıca A tipi (yarıçap oranlarından) olduğunu düşündüğüm bir madalyonun da doğru renkte olup olmadığını belirlemek istiyorum. Sorun İngiliz paraları ve ark. (bakır, gümüş, altın), ilgili renkler (özellikle bakır ila altın) benzerdir.
Verilen bir madalyonun ortalama rengini RedGreenBlue (RGB) 'renk-alanı' ve bu rengi HueSaturationBrightness (HSB veya HSV) 'renk-alanına' dönüştüren rutinleri çıkaran bir rutine sahibim.
RGB, üç jeton rengi arasında ayrım yapmaya çalışmakla çalışmak için pek hoş değildir (örneğin ekteki [temel] resme bakın). Farklı madeni para türlerinin renkleri için aşağıdaki aralıklar ve tipik değerler var:
Not: Buradaki tipik değer, gerçek bir görüntünün “piksel biçiminde” ortalaması kullanılarak seçilmiştir.
**Copper RGB/HSB:** typicalRGB = (153, 117, 89)/(26, 0.42, 0.60).
**Silver RGB/HSB:** typicalRGB = (174, 176, 180)/(220, 0.03, 0.71).
**Gold RGB/HSB:** typicalRGB = (220, 205, 160)/(45, 0.27, 0.86)
İlk önce belirli bir bozuk para rengi (RGB kullanarak) ve yukarıda verilen her bir bozuk para türü için tipik değerler arasındaki 'Öklid mesafesini' RGB değerlerini bir vektör olarak ele almaya çalıştım; bakır için biz olurdu:
farkın en küçük değeri ( ) bize verilen madalyonun hangi tip olması gerektiğini söyler. Bu yöntem kendini çok yanlış olduğunu göstermiştir.
Ayrıca sadece madeni paraların tonunu yukarıda verilen tiplerin tipik değerleriyle karşılaştırmayı da denedim. Her ne kadar teorik olarak bu, görüntülerin değişen parlaklık ve doygunluk seviyelerinin üstesinden gelmek için daha iyi bir 'renk alanı' sağlasa da, yeterince doğru değildi.
Soru: Renge dayalı bir madeni para türü belirlemek için en iyi yöntem nedir (statik bir görüntüden)?
Zaman ayırdığınız için çok teşekkürler.
Düzenle 1
Not: Aşağıda tartışılan tüm fikirleri denedim ve hiçbir şeyin yanında elde ettim. Aydınlatma koşullarındaki farklılık (aynı görüntü içerisinde bile) bu sorunu çok zorlaştırır ve dikkate alınmalıdır.
Düzenleme 2 (Sonucu Summery)
Cevaplarınız için teşekkür ederim. Kendi araştırmalarım (cevaplarınız ve yorumlarınız dahil), bu sorunun genel olarak keyfi aydınlatma, keyfi kamera (mobil cihaz), bozuk para rengindeki dalgalanma durumlarında (aynı tür / tür için bile) ele alınması gerektiğini vurguladı. İlk önce cilt renginin tanınmasına (çok aktif bir araştırma alanı) bir başlangıç noktası olarak baktım ve sadece Kafkasyalılar için ten renginin tanınmasında bile sayısız sorun var ( şu andaki teknikleri gözden geçirmek için bu makaleye bakınız ), ve bu problemin, hepsi sürekli ve değişken kromatik özelliklere sahip olabilen üç ayrı renk nesnesi içermesi, bu bilgisayar vizyonu konusunu, buna göre sınıflandırmak ve uğraşmak için çok zor bir konu haline getirmektedir. !).
Ben çok yararlı dan Gamı Kısıtlama Yöntemi içine baktım yazı aşağıda DW tarafından. Bu, ilk bakışta görüntü ve ayrı madeni para objelerini aydınlatma koşullarından bağımsız renklere dönüştürmek için ön işleme adımı olarak ümit vericiydi. Bununla birlikte, bu teknik bile mükemmel şekilde çalışmaz (ve eşleşmek istemiyorum - eşlemeler için bir resim / histogram kitaplığı içerir) ve daha karmaşık Sinir Ağı Mimarisi metodolojileri de yoktur. Aslında bu yazıda özet olarak şöyle:
"current machine colour constancy algorithms are not good enough for colour-based
object recognition.".
Bu, bu konuda daha fazla güncel makale bulunmadığını söylemek değildir, ancak onları bulamıyorum ve şu anda çok aktif bir araştırma alanı gibi görünmüyor.
Cevap AVB tarafından da yararlı oldu ve ben L içine baktım A B * kısaca.
"The nonlinear relations for L*, a*, and b* are intended to mimic the nonlinear
response of the eye. Furthermore, uniform changes of components in the L*a*b* colour
space aim to correspond to uniform changes in perceived colour, so the relative
perceptual differences between any two colours in L*a*b* can be approximated by
treating each colour as a point in a three dimensional space."
Okuduklarımdan itibaren, cihazıma bağlı görüntüler için bu renk alanına dönüşüm zor olacaktır - ancak biraz daha fazla zamanım olduğunda bunu ayrıntılı olarak inceleyeceğim (bir çeşit uygulama için).
Bu soruna somut bir çözüm için nefesimi tutmuyorum ve L A B * denemesinden sonra madalyonun rengini göz ardı ediyorum ve mevcut geometrik algılama algoritmalarımı (doğru Elliptic Hough Transform vs.) emin olmak istiyorum.
Hepinize teşekkürler. Ve bu sorunun son notu, işte, renk tanıma özelliği olmayan yeni bir geometrik algılama algoritmasıyla aynı görüntü: