Makine Öğreniminde Boyut Atlamalı


10

Makine öğreniminde boyut atlamalı problem nedir (evrişimli sinir ağlarında ve görüntü tanımada meydana gelen)? Bu konuda googledim ama elde ettiğim tek şey maddi şekil deformasyonunun fiziği hakkında bilgi. Bazıları bunu makine öğrenimi ile ilgili bir örnekle açıklarsa benim için daha yararlı olacaktır. Biri bana bu konuda yardımcı olabilir veya beni bulabilecek kaynaklara yönlendirebilir mi?

Yanıtlar:


7

DataScience.SE'ye Hoşgeldiniz! Bu problemi hiç duymamıştım, bu yüzden başardım. Bu sunumun üçüncü slaytında Geoff Hinton şöyle açıklanıyor :

Nesneleri tanımayı zorlaştıran diğer şeyler

• Bakış açısı değişiklikleri, standart öğrenme yöntemlerinin üstesinden gelemediği görüntülerde değişikliklere neden olur.

- Giriş boyutları (yani pikseller) arasında bilgi atlamaları

• Hastanın yaşının bazen normalde kilo kodlayan girdi boyutuna atladığı tıbbi bir veritabanı düşünün!

- Makine öğrenimini uygulamak için öncelikle bu boyut atlamayı ortadan kaldırmak istiyoruz.

Başka bir deyişle, aynı şeyi temsil ederken, bir girdi özelliği boyutundan diğerine taşınan veya atlayan kavramsal özelliklerle ilgilidir. Kodlandığı giriş boyutuna değişmezken, özelliğin özünü yakalamak veya ayıklamak isteriz.


Computer Vision'da kişinin görüntüdeki yerler için değişmez olmak istediğini anlıyorum, ancak yaş örneğini alamıyorum.
Martin Thoma

Bunu yaş ve kilonun bağımlı olduğu anlamına geldim, ama emin değilim; benim sunumum değil! Ya da belki tam anlamıyla yanlış sütunu kullandıkları anlamına geliyordu ve bunu tespit etmek istiyoruz.
Emre

@sdream Sadece bir yorum yaptım; Emre cevabı verdi. (Ama muhtemelen hala kabul etmelisin). CNN'lerle ilgili nokta, bir nesne başka bir yerde olduğunda sadece bir özelliğin değişmemesi değil, tam bir desenin farklı bir girişte olmasıdır.
Martin Thoma

@Emre, cevabınızdan aldığım şey, belirli bir özelliğin hangi yönden girildiğine bakılmaksızın, bu özel özelliğin neden olduğu özelliğin bu özelliğin giriş boyutuna değişmez olmasıdır. Teşekkürler! :). Hala daha spesifik cevaplar bekliyorum, aksi takdirde cevabınızı cevap olarak işaretleyeceksiniz.
sdream

3
Age örneğinin boyut atlamalı olmayan bir veri kümesini vurgulaması gerekir. Yaş ve ağırlık, örnekler arasında rastgele "sekme yapmaz" veya değerleri değiştirmez - bunlar birbirinin yerine kullanılamaz ve örnek, ne kadar garip olacağını (ve doğrusal regresyon gibi basit görevleri ne kadar zor hale getireceğini) göstermektedir. Görüntülerdeki piksel değerleri (ve birçok sinyal işleme görevindeki benzer veriler), sorunun niteliği nedeniyle kolayca değişebilir veya hareket edebilir.
Neil Slater

7

Sorunu anladığım kadarıyla şu şekildedir: Görüntü tanımada ağınıza girişler piksel olabilir (gri tonlamalı veya siyah beyaz için yalnızca 1 ve 0). Örneğin, el yazısı sayıları tanımak istiyorsanız, sadece sayının (yani siyah değerlerin) tam olarak nerede olacağını asla bilemeyeceğiniz değerlerle çalışmak çok zordur.

Piksel 140 siyah mı, yoksa 142 siyah mı? Her iki durumda da üç olabilir. Yaş / ağırlık örneğinde bu girdiler iyi tanımlanmıştır. Özellik 2 ağırlıktır. Özellik 3 yaştır. Bu "boyutlar" veri kümenizde "sıçramamalı".

Bu yüzden: Resim eğitiminizde "üçler" veya "arabalar" veya "evler", resimdeki konumlarından bağımsız olarak tanınmalıdır, yani piksel değerleri, yani özellik / giriş vektörü, yani açıkça tanımlanana göre boyutlar hasta verileri gibi girdiler.

Görüntü tanımada bunu nasıl çözersiniz? Ek numaralar kullanırsınız, örneğin evrişim.


2

Önceki cevapları okudum ve Neil Slater'ın Emre'nin gönderisine yaptığı yorum, aşağıda tekrar kopyalandı, çiviye çarptı. "Boyut atlaması", Dr. Hinton tarafından bakış açısı bağlamında makine öğrenimi öncüsü ününün yarattığı bir terimdir. Hinton'dan alıntı yapmak için "Yani, genellikle giriş boyutlarının piksele karşılık geldiğini düşünün ve bir nesne dünyada hareket ederse ve onu takip etmek için gözlerinizi hareket ettirmezseniz, nesne hakkındaki bilgiler farklı piksellerde ortaya çıkacaktır." Yaş ve ağırlık, kolayca karıştırılamayan giriş boyutudur. Hinton, bu tür veriler arasında kesinlikle herhangi bir hatalı tespit edip düzeltebileceğimiz anlamına gelmek için hastaların yaş ve kilosunu atlatma olasılığını açıkça açıklamamıştır. (Çoğu yetişkin 100 yaşın altında ve daha fazla 100 kilodan fazla). Hinton'un ele aldığı muhtemel boyut atlama problemi, farklı bir bakış açısına sahip olduğumuz için piksellerin yer değiştirebilmesidir (örneğin, nesne hareket edebilir veya farklı bir açıdan bakarız). Doğrusal sinir ağları bunu tespit edemezken, tasarımla evrişimli sinir ağları tespit eder.

"Yaş örneğinin, boyut atlamalı olmayan bir veri kümesini vurgulaması gerekir. Yaş ve ağırlık, örnekler arasında rastgele" sekmez "veya değerleri değiştirmez - bunlar birbirinin yerine kullanılamaz ve örnek bunun ne kadar tuhaf olacağını (ve nasıl olduğunu gösterir) doğrusal regresyon gibi basit görevleri yerine getirmesi zor.) Resimlerdeki piksel değerleri (ve birçok sinyal işleme görevindeki benzer veriler) sorunun doğası gereği kolayca değişebilir ya da hareket edebilir - Neil Slater 29 Mayıs'ta 18:01 "


1

Hinton'un Makine Öğrenimi için Yapay Sinir Ağları dersinden doğrudan açıklama ....

"Boyut atlaması , bazı girdilerin boyutlarında yer alan bilgileri alabilir ve hedefi değiştirmeden boyutlar arasında taşıyabildiğinde gerçekleşir . "mürekkep" içeren boyutlar artık farklıdır (diğer boyutlara taşınmıştır), ancak rakama atadığımız etiket değişmemiştir. Bunun bir şey olmadığını unutmayın. veri kümesinde tutarlı bir şekilde gerçekleşir, yani, birinin diğerinin çevrilmiş bir sürümü olduğu iki el yazısı rakam içeren bir veri kümemiz olabilir, ancak bu yine de rakamların karşılık gelen etiketini değiştirmez. "


0

Atlama, yalnızca görüntünün veya boyutun (çoğunlukla) ve bazen başka bir loş (farklı alıcı alan) içine hareket eden kısımları ile ilgilidir, ancak çıktı aynı kalır.

Bu sorun değişmezlik veya eşdeğerlik ile ele alınır ve ağırlık ve yaş örneğinin belirtmenin kolay yolu gibi görünmektedir. Bu ağırlık ve yaş atlamalı olduğunun farkında olursak, algoda kolayca değişiklik yapıp doğru sonuç alacağımızı varsayalım. Ancak veri / bilgi atlaması gibi, görüntü atlaması da olur, eğer '4' ve '4' farklı hedefleri olan farklı sınıflar olmak için birkaç pikseli sola kaydırırsak.

Çeviri Değişmezliği veya daha iyi bir eşdeğerlik ile filtreleme, bu hareketi veya atlamayı karmaşıklık ve konum gibi bilgileri atma pahasına artırsa da çok fazla sorun değildir.

Pls daha fazla netliğe ihtiyacınız varsa bana bildirin.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.