Bir sayı vektörü girdi olarak alan ve çıktı olarak bir sınıf etiketi veren bir sınıflandırıcı öğrenmek istediğimizi varsayalım. Egzersiz verilerim çok sayıda girdi-çıktı çiftinden oluşuyor.
Ancak, bazı yeni veriler üzerinde test yapmaya geldiğimde, bu veriler genellikle sadece kısmen tamamlanır. Örneğin, giriş vektörü 100 uzunluğundaysa, elemanların sadece 30'una değerler verilebilir ve geri kalanı "bilinmiyor" olabilir.
Bunun bir örneği olarak, görüntünün bir kısmının tıkalı olduğu bilindiğinde görüntü tanımayı düşünün. Veya, verilerin bir kısmının bozuk olduğu bilinen bir anlamda sınıflandırmayı düşünün. Her durumda, veri vektöründeki hangi öğelerin bilinmeyen parçalar olduğunu tam olarak biliyorum.
Bu tür veriler için işe yarayan bir sınıflandırıcıyı nasıl öğrenebileceğimi merak ediyorum? "Bilinmeyen" öğeleri rastgele bir sayıya ayarlayabilirdim, ancak genellikle bilinenden daha fazla bilinmeyen öğe olduğu için bu iyi bir çözüm gibi gelmiyor. Ya da, eğitim verilerindeki öğeleri rastgele olarak "bilinmeyen" olarak değiştirebilir ve tüm veriler yerine bunlarla çalışabilirim, ancak bu, bilinen ve bilinmeyen öğelerin tüm kombinasyonlarının kapsamlı bir şekilde örneklenmesini gerektirebilir.
Özellikle sinir ağlarını düşünüyorum ama diğer sınıflandırıcılara da açığım.
Herhangi bir fikir? Teşekkürler!