Eh soru her şeyi söylüyor.
"Sinir ağının ön eğitimi" ile ne kastedilmektedir? Birisi basit basit İngilizce olarak açıklayabilir mi?
Bununla ilgili herhangi bir kaynak bulamıyorum. Biri beni onlara yönlendirebilirse çok iyi olur.
Eh soru her şeyi söylüyor.
"Sinir ağının ön eğitimi" ile ne kastedilmektedir? Birisi basit basit İngilizce olarak açıklayabilir mi?
Bununla ilgili herhangi bir kaynak bulamıyorum. Biri beni onlara yönlendirebilirse çok iyi olur.
Yanıtlar:
Bir ağı eğitmenin normal yolu:
Bir veri kümesinde (örneğin bir resim kümesi) bir görevi (örneğin sınıflandırma) gerçekleştirmek için sinir ağını eğitmek istiyorsunuz. Ağırlıkları rastgele başlatarak eğitime başlarsınız. Eğitime başlar başlamaz, görevi daha az hatayla (yani optimizasyon) yapmak için ağırlıklar değiştirilir. Eğitim sonuçlarından memnun kaldığınızda, ağınızın ağırlığını bir yerde saklarsınız.
Artık farklı bir veri setinde (örneğin görüntüler de daha önce kullandıklarınızla aynı olmayan görüntüler) yeni bir görev (örneğin, nesne algılama) gerçekleştirmek için bir ağı eğitmekle ilgileniyorsunuz. İlk ağ için yaptıklarınızı tekrarlamak ve rastgele başlatılmış ağırlıklar ile antrenman yapmak yerine, önceki denemeden kaydettiğiniz ağırlıkları yeni denemeniz için başlangıç ağırlık değerleri olarak kullanabilirsiniz. Ağırlıkları bu şekilde başlatmak, önceden eğitilmiş bir ağ kullanmak olarak adlandırılır. İlk ağ, önceden eğitilmiş ağınızdır. İkincisi, ince ayar yaptığınız ağdır.
Ön eğitimin arkasındaki fikir, rastgele başlatmanın ... iyi ... rastgele, ağırlıkların değerlerinin, çözmeye çalıştığınız görevle ilgisi olmadığıdır. Neden bir dizi değer diğerinden daha iyi olsun ki? Fakat ağırlıkları başka nasıl başlatabilirsin? Görevleri için bunları doğru şekilde nasıl başlatacağınızı biliyorsanız, bunları en iyi değerlere (biraz abartılı) ayarlayabilirsiniz. Hiçbir şey eğitmene gerek yok. Probleminize en uygun çözüme sahipsiniz. Ön eğitim ağa bir başlangıç sağlar. Daha önce verileri görmüş gibiydi.
Antrenman sırasında nelere dikkat edilmeli:
Ağın ön eğitiminde kullanılan ilk görev, ince ayar aşaması ile aynı olabilir. Antrenman öncesi ve ince ayar için kullanılan veri setleri de aynı olabilir, ancak farklı olabilir. Farklı bir görev ve farklı veri kümesindeki ön eğitimin hala biraz farklı olan yeni bir veri kümesine ve yeni bir göreve nasıl aktarılabileceğini görmek gerçekten ilginç . Önceden eğitilmiş bir ağın kullanılması genellikle hem görevlerin hem de her iki veri kümesinin ortak bir özelliği olup olmadığını anlamlıdır. Boşluk arttıkça, ön eğitim daha az etkili olacaktır. İlk önce finansal veriler üzerinde eğiterek bir ağın görüntü sınıflandırma için ön eğitilmesi çok mantıklı değildir. Bu durumda , antrenman öncesi ve ince ayar aşamaları arasında çok fazla bağlantı kesilmesi var .
Pretraining / fine-tuning şu şekilde çalışır:
Bu transfer öğrenmenin bir şeklidir. Böylece, veri kümesi elde edilen bilgilerin kısmını veri kümesi aktarabilirsiniz . Çok az kelimeyle açıklanan bu ve daha fazla terim için Makine Öğrenim Sözlüğüme bakın .