Tüm giriş düğümleri (geri yayılımlı olsun veya olmasın) için ileri beslemeli bir ağ için girdi olarak, ayrık veya sürekli normalize edilmiş değerlere (örn. (1; 3) göre ikili değerleri (0/1) tercih etmenin iyi bir nedeni var mı?
Tabii ki, sadece her iki formata dönüştürülebilecek girdilerden bahsediyorum; örneğin, birden fazla değer alabilen bir değişkeniniz varsa, bunları doğrudan bir giriş düğümünün değeri olarak besleyin veya her ayrık değer için bir ikili düğüm oluşturun . Ve varsayım, olası değerlerin aralığının tüm giriş düğümleri için aynı olacağı varsayımıdır . Her iki olasılık için bir fotoğrafa bakın.
Bu konuyu araştırırken, bu konuda soğuk ve sert gerçekler bulamadım; Bana öyle geliyor ki - az çok - sonunda her zaman “deneme yanılma” olacak. Tabii ki, her ayrık giriş değeri için ikili düğümler daha fazla giriş katmanı düğümü (ve dolayısıyla daha gizli katman düğümleri) anlamına gelir, ancak bir düğümde aynı değerlere sahip olmaktan çok daha iyi bir çıkış sınıflandırması üretir, gizli katman?
Bunun sadece "dene ve gör" olduğunu kabul eder misin yoksa bu konuda başka bir fikrin var mı?