Bu Cib2011'in ilk cevabı için bir riff. Kısa cevap hayır olmalı. Daha uzun - Öncelikle fotoğraflar her zaman aşağıdaki gibi bir tensör olarak kodlanır. Bir görüntü piksel sayısıdır. Fotoğrafın m satırı ve n sütunu olduğu düşünülürse, her piksel satır ve sütun konumu, yani çift (m, n) ile belirtilir. Özellikle 'küçük' fotoğraflar için bile çok büyük olan m * n pikseller vardır. Fotoğrafın her pikseli, fotoğraf siyah beyazsa, sıfır ile bir (siyahlık yoğunluğu) arasındaki bir sayı ile kodlanır. Fotoğraf renkliyse, üç sayı (RGB yoğunluğu) ile kodlanır. Yani 1xmxn ya da 3xmxn olan bir tensör ile sarılır. Görüntü tanıma fotoğraflar pikselden piksele o kadar değişmez gerçeği yararlanarak, CNN en hangi aracılığıyla yapılır, kompresfiltreler ve havuzlama yoluyla veri. Buradaki nokta, CNN'in bir fotoğrafın inanılmaz sayıda veri noktasını (veya özelliğini) daha az sayıda değere sıkıştırarak çalışmasıdır. Hangi formatla başlarsanız başlasın CNN'ler fotoğrafın verilerini daha da sıkıştırarak başlar. Bu nedenle, fotoğrafın temsil boyutundan kendiliğinden bağımsızlık.
Bununla birlikte, bir CNN, içinden geçen tüm görüntülerin aynı boyutta olmasını talep edecektir. Yani görüntünün nasıl kaydedildiğine bağlı olarak değişecek bir bağımlılık var. Ayrıca, aynı boyuttaki farklı dosya biçimlerinin tansörleri için farklı değerler ürettiği ölçüde, farklı yöntemler ile depolanan fotoğrafları tanımlamak için aynı CNN modelini kullanamazsınız.