Biyolojik ve yapay sinir ağları arasında güçlü bir benzerlik beklememesine dikkat ediyorum. Bence "sinir ağları" adı biraz tehlikeli, çünkü insanları nörolojik süreçlerin ve makine öğrenmenin aynı olması gerektiğini beklemeye zorluyor. Biyolojik ve yapay sinir ağları arasındaki farklılıklar benzerliklerden ağır basmaktadır.
Bunun nasıl kötüye gidebileceğinin bir örneği olarak, orijinal yazıdaki akıl yürütmeyi kafasına da çevirebilirsiniz. Oldukça hızlı bir bilgisayar ve bir miktar eğitim verisi olması koşuluyla, bir öğleden sonra otomobilleri tanımayı öğrenmek için bir sinir ağı eğitebilirsiniz. Bunu ikili bir görev (araba / araba değil) veya çok sınıflı bir görev (araba / tramvay / bisiklet / uçak / tekne) yapabilir ve yine de yüksek bir başarı seviyesinden emin olabilirsiniz.
Buna karşılık, bir çocuğun bir gün - hatta hatta haftada - bir araba seçmesini beklemedim, hatta "çok fazla eğitim örneği" gördükten sonra bile. İki yaşındaki bir çocuk ile öğrenme kabiliyeti arasındaki farkı hesaba katan bir bebek arasında bir şeyler açıkça belirgindir; oysa ki vanilya görüntü sınıflandırma sinir ağı “doğumdan” hemen sonra nesne sınıflandırmasını mükemmel bir şekilde yapabilir . İki önemli fark olduğunu düşünüyorum: (1) mevcut eğitim verilerinin göreceli hacimleri ve (2) bol miktarda eğitim verisi nedeniyle zaman içinde gelişen bir kendi kendini öğretme mekanizması.
Orijinal yazı iki soru ortaya koyuyor. Sorunun başlığı ve gövdesi sinir ağlarının neden "bu kadar çok örneğe" ihtiyacı olduğunu soruyor. Çocuğun deneyimine göre, ortak görüntü kıyaslamaları kullanılarak eğitilmiş sinir ağları nispeten az veriye sahiptir.
Başlıktaki soruyu tekrar yazacağım
“Ortak bir görüntü kıyaslaması için bir sinir ağını eğitmek bir çocuğun öğrenme deneyimiyle karşılaştırır ve karşılaştırır?”
Karşılaştırma amacıyla CIFAR-10 verilerini dikkate alacağım, çünkü bu ortak bir görüntü kıyaslaması. Etiketli kısım, sınıf başına 6000 görüntü içeren 10 görüntü sınıfından oluşur. Her görüntü 32x32 pikseldir. Bir şekilde CIFAR-10'dan etiketli görüntüleri istiflediyseniz ve standart bir 48 fps video yaptıysanız, yaklaşık 20 dakikalık bir çekiminiz olur.
Dünyayı günde 12 saat gözlemleyen 2 yaşındaki bir çocuğun yaklaşık 263000 dakika (4000 saatten fazla), yetişkinlerden gelen geri bildirimler (etiketler) de dahil olmak üzere doğrudan gözlemleri vardır. (Bunlar sadece basketbol sahası rakamlarıdır - tipik bir iki yaşındaki çocuğun dünyayı gözlemlemek için kaç dakika harcadığını bilmiyorum.) Ayrıca, çocuk CIFAR'ı oluşturan 10 sınıfın ötesinde birçok nesneye maruz kalacak 10.
Yani oyunda birkaç şey var. Birincisi, çocuğun genel olarak daha fazla veriye maruz kalması ve CIFAR-10 modelinden daha çeşitli veri kaynaklarına sahip olmasıdır. Veri çeşitliliği ve veri hacmi, genel olarak sağlam modeller için ön koşul olarak kabul edilmektedir. Bu bağlamda, bir sinir ağının bu görevde çocuktan daha kötü olması şaşırtıcı görünmemektedir, çünkü CIFAR-10'da eğitilmiş bir sinir ağı, iki yaşına göre eğitim verisi için pozitif olarak aç bırakılmıştır. Bir çocuk için mevcut olan görüntü çözünürlüğü 32x32 CIFAR-10 görüntülerinden daha iyidir, böylece çocuk nesnelerin ince ayrıntıları hakkında bilgi edinebilir.
CIFAR-10 ile iki yaş arasındaki karşılaştırma mükemmel değildir çünkü CIFAR-10 modeli aynı statik görüntüler üzerinde çoklu geçişlerle eğitilirken, çocuk dürbün vizyonu kullanarak nesnelerin üçte nasıl düzenlendiğini görecektir. boyutsal dünya, farklı nesneler üzerinde ve farklı aydınlatma koşullarında ve bakış açılarıyla hareket ederken.
OP’nin çocuğuyla ilgili fıkra, ikinci bir soruya işaret ediyor:
“Sinir ağları nasıl kendi kendine öğretilebilir?”
Bir çocuğa kendi kendine öğretme kabiliyeti vardır, böylece sıfırdan başlamak zorunda kalmadan zaman içinde yeni nesne kategorileri eklenebilir.
OP'nin transfer öğrenmesi konusundaki sözleri , makine öğrenmesi bağlamında bir tür model uyarlamasıdır.
Yorumlarda, diğer kullanıcılar bir veya birkaç atışla öğrenmenin * başka bir makine öğrenimi araştırma alanı olduğunu belirtti.
Ek olarak, takviye öğrenme , kendi kendine öğretme modellerini farklı bir perspektiften ele alır, temel olarak robotların belirli problemleri çözmek için en uygun stratejileri (örneğin satranç oynamak) bulmak için deneme yanılma deneyimlerini yapmalarına izin verir.
Bu makine öğrenme paradigmalarının üçünün de, makinelerin yeni bilgisayar vizyonu görevlerine adapte olmalarını iyileştirmeye yönelik olması muhtemeldir. Makine öğrenim modellerini hızla yeni görevlere uyarlamak aktif bir araştırma alanıdır. Ancak, bu projelerin pratik hedefleri (yeni kötü amaçlı yazılım örneklerini tanımlayın, pasaport fotoğraflarındaki sahtekarları tanıyın, interneti endeksleyin) ve başarı ölçütleri, dünyayı öğrenen bir çocuğun hedeflerinden ve bu konuda yapılanlardan farklı olduğundan, matematik kullanan bir bilgisayar ve diğeri kimya kullanılarak organik malzemede yapıldığında, ikisi arasındaki doğrudan karşılaştırmalar suya karışmaya devam edecektir.
Bir kenara, CIFAR-10 probleminin etrafında nasıl döndürüleceğini araştırmak ve her birinin 10 örneğinden 6000 nesneyi tanımak için bir sinir ağını eğitmek ilginç olurdu. Ancak bu bile, 2 yaşındaki ile kıyaslandığında adil bir karşılaştırma olmazdı çünkü eğitim verilerinin toplam hacmi, çeşitliliği ve çözümünde hala büyük bir tutarsızlık olacaktı.
* Şu anda bir kerelik öğrenme veya az sayıdaki öğrenme için bir etiketimiz bulunmamaktadır.