Önceki cevaplar gerçekten harika, birkaç ekleme daha belirtmek isterim:
Nesne Segmentasyonu
Bunun araştırma camiasında gözden düşmesinin nedenlerinden biri sorunlu olarak belirsiz olmasıdır. Nesne bölütleme, basitçe bir görüntüdeki tek veya az sayıda nesneyi bulmak ve bunların etrafına bir sınır çizmek anlamına gelir ve çoğu amaç için hala bunun anlamına geldiğini varsayabilirsiniz. Bununla birlikte, nesneler olabilecek lekelerin bölümlenmesi, nesnelerin arka plandan bölümlenmesi anlamında da kullanılmaya başlanmıştır. (daha yaygın olarak şimdi arka plan çıkarma veya arka plan segmentasyonu veya ön plan algılama olarak adlandırılır) ve hatta bazı durumlarda sınırlayıcı kutular kullanılarak nesne tanıma ile birbirinin yerine kullanılır (bu, nesne tanımaya yönelik derin sinir ağı yaklaşımlarının ortaya çıkmasıyla hızla durdu, ancak önceden nesne tanıma da basitçe tüm bir görüntünün içindeki nesne ile etiketlenmesi anlamına gelir).
"Segmentasyonu" "anlamsal" yapan nedir?
Simpy, her segment veya derin yöntemler söz konusu olduğunda her piksele bir kategoriye dayalı bir sınıf etiketi verilir. Genel olarak bölümleme, görüntünün bazı kurallara göre bölünmesidir. Meanshift segmentasyonu, örneğin çok yüksek bir seviyeden verileri görüntünün enerjisindeki değişikliklere göre böler. Grafik kesimitabanlı bölümleme benzer şekilde öğrenilmez, ancak doğrudan her görüntünün diğerlerinden ayrı özelliklerinden türetilir. Daha yeni (sinir ağı tabanlı) yöntemler, belirli sınıflarla ilişkili yerel özellikleri tanımlamayı öğrenmek için etiketlenmiş pikselleri kullanır ve ardından her pikseli hangi sınıfın o piksel için en yüksek güvene sahip olduğuna göre sınıflandırır. Bu şekilde, "piksel etiketleme" aslında görev için daha dürüst bir isimdir ve "segmentasyon" bileşeni ortaya çıkar.
Örnek Segmentasyonu
Muhtemelen Nesne Segmentasyonunun en zor, alakalı ve orijinal anlamı olan "örnek bölümleme", aynı türde olup olmadıklarına bakılmaksızın bir sahne içindeki tek tek nesnelerin bölümlere ayrılması anlamına gelir. Bununla birlikte, bunun bu kadar zor olmasının nedenlerinden biri, vizyon perspektifinden (ve bazı yönlerden felsefi olan) bir "nesne" örneğini oluşturan şeyin tamamen açık olmamasıdır. Vücut parçaları nesne mi? Bu tür "parça nesneler", bir örnek bölümleme algoritması ile hiç parçalanmalı mı? Yalnızca bütünden ayrı görüldüklerinde bölümlere mi ayrılmalılar? Bileşik nesneler, açıkça bitişik ancak birbirinden ayrılabilen iki nesne bir veya iki nesne olmalıdır (bir sopanın tepesine yapıştırılmış bir kaya, bir balta, bir çekiç veya sadece bir sopa ve bir taş, düzgün yapılmadıkça mı?). Ayrıca, değil t Örneklerin nasıl ayırt edileceğini netleştirme. İrade, bağlı olduğu diğer duvarlardan ayrı bir örnek mi? Örnekler hangi sırada sayılmalıdır? Göründükleri gibi mi? Bakış açısına yakınlık? Bu zorluklara rağmen, nesnelerin bölümlendirilmesi hala büyük bir sorun çünkü insanlar olarak biz nesnelerle her zaman etkileşimde bulunuyoruz "sınıf etiketleri" ne olursa olsun (etrafınızdaki rastgele nesneleri kağıt ağırlık olarak kullanmak, sandalye olmayan şeylerin üzerine oturmak), ve bu nedenle bazı veri kümeleri bu soruna ulaşmaya çalışır, ancak soruna henüz çok fazla önem verilmemesinin ana nedeni, yeterince iyi tanımlanmamış olmasıdır.
Sahne Ayrıştırma / Sahne etiketleme
Sahne Ayrıştırma, kendi başına bazı belirsizlik sorunları olan sahne etiketlemeye katı bir bölümleme yaklaşımıdır. Tarihsel olarak, sahne etiketlemesi tüm "sahneyi" (görüntü) bölümlere ayırmak ve hepsine bir sınıf etiketi vermek anlamına geliyordu. Bununla birlikte, görüntünün alanlarına açıkça bölümlere ayırmadan sınıf etiketleri vermek için de kullanıldı. Segmentasyon ile ilgili olarak, "semantik segmentasyon" değil , tüm sahneyi bölen ima. Anlamsal bölümleme için, algoritma yalnızca bildiği nesneleri bölümlere ayırmayı amaçlamaktadır ve herhangi bir etiketi olmayan pikselleri etiketlemek için kayıp işlevi tarafından cezalandırılacaktır. Örneğin, MS-COCO veri kümesi, yalnızca bazı nesnelerin bölümlere ayrıldığı anlamsal bölümleme için bir veri kümesidir.