“Çeviriye Eşdeğer” ile “Çeviriye Değişmeyen” arasındaki fark nedir


38

Ben sorun arasındaki farkı anlamak yaşıyorum çeviri equivariant ve çeviri değişmez .

Derin Öğrenme kitabında . MIT Press, 2016 (I. Goodfellow, A. Courville ve Y. Bengio), evrişimsel ağlarda bulabilirsiniz:

  • [...] belirli parametre paylaşım biçimi, katmanın çeviriye eşdeğerlik denilen bir özelliğe sahip olmasına neden olur
  • [...] havuzlama, gösterimin girdilerin küçük çevirileri için yaklaşık olarak değişmez hale gelmesine yardımcı olur

Aralarında fark var mı veya terimler birbirinin yerine kullanılıyor mu?


2
İstatistiğin eski günlerinde, Pitman zamanında olduğu gibi, eşdeğer anlamında da değişmez kullanılmıştır.
Xi'an

Yanıtlar:


39

Eşdeğerlik ve değişmezlik bazen birbirinin yerine kullanılır. @ Xi'an'ın belirttiği gibi , istatistik literatüründe, örneğin değişmez tahmin edicinin ve özellikle de Pitman tahmincisinin nosyonlarında bulabilirsiniz .

Ancak, ben söz istiyorum hem terimler ayrılmış devam edersek daha iyi olur önek olarak, " in " in değişmez iken, menfi (hiç "hayır varyansı" anlamına gelir) olan " eşit " in equivariant farklılaşan" anlamına gelir benzer veya eşdeğer oranda ". Başka bir deyişle, biri hareket etmiyor, diğeri hareket ediyor .

Im(xm,ym)II(u,v)

mIm=m(xm,ym)=(xmu,ymv)

Eşdeğerlik için matematikte verilen kesin formülasyonlar, kişinin göz önünde bulundurduğu nesnelere ve dönüşümlere bağlıdır, bu yüzden burada pratikte en sık kullanılan kavramı tercih ediyorum (ve suçu teorik bir bakış açısıyla alabilirim).

GgfGg

f(g(I))=f(I).

GG ggG

f(g(I))=g(f(I)).

ggG=G

Başka bir yaygın tanım şudur:

f(g(I))=g(f(I)).

GGf(I)g(I)ggg

Çoğunlukla, insanlar eşitlik kavramı bilinmediğinden veya başkaları değişmezliği kullandığından ve eşitlik kavramı daha bilgili göründüğü için değişmezlik terimini kullanır.

Kayıt için, diğer ilgili kavramlar (özellikle matematik ve fizikte) kovaryans , kontravaryans , diferansiyel değişmezlik olarak adlandırılır .

Ek olarak, çeviri değişmezliği, en azından yaklaşık veya zarf içinde, çeşitli sinyal ve görüntü işleme araçları için bir arayış olmuştur. Özellikle, çok oranlı (filtre bankaları) ve çok ölçekli (dalgacıklar veya piramitler) dönüşümler, son 25 yılda, örneğin değişmez, değişmeyen, döngü bükümlü, sabit, karmaşık, çift ağaçlı bir başlık altında tasarlandı. Dalgacık dönüşümleri (2B dalgacıkları gözden geçirmek için, Çok ölçekli geometrik gösterimler üzerine bir panorama ). Dalgacık, birkaç farklı ölçek değişimini emebilir. Tüm tezler (yaklaşık) değişmezler çoğu zaman dönüştürülmüş katsayıların sayısındaki fazlalık fiyatıyla birlikte gelir. Fakat vardiya değişmez veya vardiya eşdeğer özellikler üretme olasılıkları daha yüksektir.


4
Harika! Ayrıntılı cevap için çabalarınızı gerçekten takdir ediyorum @Laurent Duval
Aamir

24

Terimler farklı:

  • Çeviriye eşdeğer, giriş özelliklerinin çevirisinin, çıktıların denk çevirisine yol açtığı anlamına gelir. Bu nedenle, girişteki 0,3,2,0,0 şablonunuz çıktıda 0,1,0,0 olarak sonuçlanırsa, 0,0,3,2,0 paterni 0,0,1'e yol açabilir, 0

  • Çeviriye göre değişmez , girdi özelliklerinin çevirisinin çıktıları hiç değiştirmeyeceği anlamına gelir. Bu nedenle, girişteki 0,3,2,0,0 şablonunuz çıktıda 0,1,0 olur, sonra 0,0,3,2,0 paterni de 0,1,0 olur.

Evrişimli ağlardaki özellik haritalarının kullanışlı olması için, genellikle bazı dengelerde her iki özelliğe de ihtiyaç duyarlar. Eşdeğerlik, ağın farklı konumlarda kenar, doku ve şekil algılamayı genelleştirmesini sağlar. Değişmezlik, tespit edilen özelliklerin kesin konumunun daha az önemli olmasını sağlar. Bunlar, birçok görüntü işleme görevi için iki tamamlayıcı genelleme türüdür.


Çevrilmiş özellik, bazı katmanlarda çevrilmiş çıktılar verir. Lütfen tespit edilen önemli ölçüde çevrilmiş tüm nesneyi açıklayınız. CNN farklı pozisyonlar içeren görüntülerle eğitilmemiş olsa bile tespit edilebileceği görülüyor mu? Bu durumda eşdeğerlik geçerli midir (değişmezliğe daha çok benziyor)?
VladimirLenin

@VladimirLenin: Bu soru için detaylandırmanın gerekli olduğunu düşünmüyorum, kesinlikle OP'nin burada istediği bir şey değil. Mümkünse somut bir örnekle ayrı bir soru sormanızı öneririm. Görsel olarak "bütün bir nesne" çevrilmiş olsa bile, bu bir CNN'deki özellik haritalarının beklediğinizle aynı şeyi izlediği anlamına gelmez.
Neil Slater

4

Sadece 2 kuruş ekledim

f:ILIL

  • f:IL
  • f:LL

ve aşağıdaki özellikleri kullanarak gerçekleştirilir

  • Katman Girişinde bir kayma olarak ConvLayer (Uzamsal 2D Convolution + NonLin, örneğin ReLU) ile ilgili mekansal denklik, Katman Çıkışında bir kayma meydana getirir (Not: tek Katlamalı Operatör ile değil, Katmanla ilgilidir)
  • Havuz İşletmecisi ile ilgili mekansal değişmezlik (örneğin, Max Havuzlama, mekansal konumundan bağımsız olarak alıcı alanındaki maksimum değerin üzerinden geçer)

I

L

Ön uçta tamamen bağlı katmanların kullanılması, sınıflandırıcının arka uç yapısına bağlı olarak bir dereceye kadar özellik konumuna duyarlı olmasını sağlar: daha derin ve kullanılan çeviri değişmez operatörü (Havuzlama)

Gösterilmiştir Evrişimsel Sinir Ağları içinde ükler Tercüme-Invariance yerine endüktif önyargı üzerine (mimarlık dolayısıyla derinliği, havuzlama, ...) o veri kümesi önyargı hareket etmeye daha etkilidir (veri büyütme davranmakla CNN Sınıflandırıcı Çeviri değişmezlik artırmak için )

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.