Teknik terimlerin yanlış kullanımı için özür diler. Evrişimli sinir ağları (CNN'ler) aracılığıyla anlamsal bölümleme projesi üzerinde çalışıyorum; Encoder-Decoder türünde bir mimari uygulamaya çalıştığından, çıktı girdiyle aynı boyuttadır.
Etiketleri nasıl tasarlıyorsunuz? Hangi kayıp fonksiyonu uygulanmalıdır? Özellikle ağır sınıf dengesizliği durumunda (ancak sınıflar arasındaki oran görüntüden görüntüye değişir).
Sorun iki sınıfla ilgilidir (ilgilenilen nesneler ve arka plan). Keras'ı tensorflow arka ucuyla kullanıyorum.
Şimdiye kadar, piksel çıktısı etiketleme uygulayarak, beklenen çıktıların girdi resimleriyle aynı boyutlarda olmasını tasarlıyorum. Modelin son katmanı ya softmax aktivasyonuna (2 sınıf için) ya da sigmoid aktivasyonuna (piksellerin nesne sınıfına ait olma olasılığını ifade etmek için) sahiptir. Bu tür bir görev için uygun bir objektif fonksiyon tasarlama konusunda sorun yaşıyorum:
function(y_pred,y_true)
,
Lütfen, ilgili tensörlerin boyutlarına (modelin girdi / çıktı) özel olmaya çalışın. Herhangi bir düşünce ve öneriniz çok takdir edilmektedir. Teşekkür ederim !