İnsan gözü gibi yüksek dinamik aralığa sahip bir sensör oluşturmanın arkasındaki teknik zorluklar nelerdir?


17

Neden bir resmin her bölümünde doğru pozlamaya sahip yüksek dinamik aralık sensörlerine sahip değiliz?


2
Aslında cevapladıktan sonra bunun zaten burada tartışıldığını gördüm . Bu sizin için her şeye cevap vermiyorsa, sorunuzu daha fazla ayrıntıyla genişletmeyi düşünün.
mivilar

Bir BlackMagic (full HD video) kamerada EV 14, modern profesyonel video kameralarda (4K) 18 EV bulunur. Yani bu sensörlere sahibiz ...
TFuto

Yanıtlar:


20

Anında ve genel olarak DR'nin insan gözünden daha büyük olduğu kameralar zaten var. İnsan gözünün dinamik aralığı çoğu insanın düşündüğü kadar büyük değildir. Hatırladığım kadarıyla, modern bir DSLR seviyesi civarında 12 ila 16 EV civarında bir yerde.

Birincil fark, görüntünün farklı kısımları için ayarlanacak son derece doğal diyafram kontrolümüzün olmasıdır. Beynimiz etkili bir şekilde bizim için otomatik olarak görüntü istifleme yapar. Bir sahnenin parlak kısmına baktığımızda, öğrencilerimiz küçülür ve parlak kısmın detayını görürüz. Vardığımız zaman daha karanlık kısma odaklanırsak, öğrencilerimiz hızla açılır ve karanlık kısmın detayını görürüz. Beynimiz, önceki bölümün neye benzediğini biliyor ve bu nedenle çevresel vizyonumuzdaki değişikliği fark etmiyoruz, ancak aslında artık odaklanmadığımız kadar fazla ayrıntı görmüyoruz.

Benzer şekilde, genel insan vizyonu yelpazesi için bile, bizden çok daha karanlık gidebilen ve özellikle renk görebilen özel kameralar var, şu anda genel halk için üretmek için çok pahalılar çünkü gürültü zemin süper düşük olsun. Ayrıca, insanların bakması acı verici çok parlak nesnelere bakabilen sensörler de vardır.


AJ, DSLR'nin gözle aynı dinamik aralığı yoktur. DSLR için 14'ün gücü 2, insan gözü 14'ün gücü 10
Romeo Ninov

@RomeoNinov - anlık DR için değil, sadece görünür. Talebiniz için bir kaynağınız var mı? Benim kaynağım burada "Eğer bunun yerine gözümüzün anlık dinamik aralığını (öğrenci açıklığımızın değişmediği yerde) dikkate alsaydık, kameralar çok daha iyi çalışırdı. Bu durumda, çoğu zaman gözlerimizin dinamik aralık 10-14 f-stop arasında herhangi bir yerde görebileceğini tahmin "
AJ Henderson

@RomeoNinov - biraz daha iyi bir kaynak . Bu nedenle, kameraların zayıf olduğu yerlerde gözlerimizin daha iyi yaptığını, ancak kameraların daha iyi yaptığı yerlerde gözlerimizin daha kötü olduğunu belirtmek gerekir. Gölgelerde, kameraların EV'leri azalttığı 20EV var. Parlaklıkta yaklaşık 10EV var ama kameraların tam 12 ila 14EV var. 10 ^ 14, gözlerimiz ayarlandığında görebildiğimiz toplam aralıktır, herhangi bir anda gördüğümüz şey değil. Ve bu açıdan, kameralar da 2 ^ 14 ile sınırlı değil.
AJ Henderson

evet, kameralar ham görüntünüzün bit derinliği ile sınırlıdır. Görüntüden daha fazla bit veya daha fazla bilgi alamazsınız. Görüntü beyninin "görme" nin sadece gözlerden bir görüntü olmadığı konusunda hemfikirim, ayrıca beynin görüntüsüne çok fazla bilgi ekleyen iki göz kullanıyoruz. İkinci yorumda bahsettiğiniz kaynakta, 10 gücünde dinamik göz aralığı görüyorsunuz. DR sadece 12 EV olsa bile,
milyonlarca

1
Ancak , herhangi bir zamanda altı duraklı bir DR ile sınırlı bir sensör bile , TV ve Av'ı değiştirerek birbirini izleyen karelerde çok karanlıktan çok parlak değerlere kadar ayrıntıyı ölçmek için kullanılabilir! Diyafram açısından göz / beyin sisteminin yaptığı budur.
Michael C

10

Görme aktif bir süreçtir

Büyük bir sorun, gözlerinizle bakmak bir görüntü yakalamadan çok farklıdır - bir görüntünün , bakıcının bakabileceği tüm bilgileri içermesi gerekir , ancak normal görme, gözlerin hareketini, yeniden odaklanmasını ve öğrencilerin genişlemesini içeren aktif bir süreçtir. baktığımız nesnelere. Bu nedenle, "gözün gördüklerini" yakalamak istiyorsanız, özünde, bakış açısını gözün kullanabileceği tüm ayarları yakalayın .

Sorunuz dinamik aralık ile ilgili, ancak aynı sorun görsel ayrıntı ve odak ile ortaya çıkıyor. 'Yaşam eşdeğeri' bir görüntü, göz çözünürlüğünün gerçekte yakalayabileceğinden çok daha fazla piksele ihtiyaç duyar, çünkü göz çözünürlüğü çok eşit değildir ve yüksek çözünürlüklü retinanın ortasıyla yalnızca tek bir küçük noktaya bakarken, bir görüntü gerekir daha fazla detay mevcut çünkü gözlerinizi hareket ettireceksiniz. Filmlerin tek bir odak seçmesi gerekirken, insanlar gözleri hızlı bir şekilde yeniden odaklayarak ve / veya farklı amaçlanan aralıklarda (örneğin bir pencerenin yüzeyine veya içinden bakarken) uygun dürbün görüş için hareket ettirerek 'tek bir görüntüyü' daha derinlemesine izleyebilir. ), vb.

Çözümün bir kısmı, farklı ayarlarda çeşitli görüntüleri yakalamak ve daha sonra birleştirmek için tek bir kamerayı hızlı bir şekilde birkaç kez (veya birden fazla kamera) kullanmak, HDR'nin en açık örnektir - tıpkı gözümüzün yaptığı gibi, aktif olarak görünüyor farklı "ayarlara" sahip farklı yerlerde, ve daha sonra beyniniz hepsini tutarlı bir resim veya filmde birleştirir. Gözlerimiz tarafından alınan gerçek "görüntüler" zaten iyi kameralardan daha kötü, sadece zihinsel kombinasyonu güzel.


1
Filmlere odaklanma noktanız için +1. Bu aynı zamanda birçok kişinin 3D film izlerken baş ağrısına neden olmasının ana nedenlerinden biriyle de ilgilidir. Göz fiziksel olarak ekrana odaklanmalıdır, ancak stereoskopik görüntü beyni, ekranın bazı bölümlerinin gerçekte olduğundan daha yakın veya daha uzak olduğunu düşünerek kandırır ve doğrudan onlara bakmaya çalıştığınızda göz yorgunluğuna neden olur. Stüdyolar, sahnenin odak noktasını hem sol hem de sağ görüntülerde aynı yerde görüntüleyerek bunu en aza indirmeye çalışır. Arka plan detaylarına bakmak isterseniz, ibuprofen'i unutmayın!
bcrist

Görmenin aktif bir süreç olması, gerçekten iyi sanatçıların basit bir fotoğraftan daha iyi görünen resimler üretmelerinin nedenlerinden biridir. Basit bir fotoğraf, sahnedeki her şeyi aynı bakış açısı, odak, pozlama ve beyaz dengesi özelliklerine sahipken, sahneyi gerçekten görüntüleyen birinin gözleri farklı bölümlere baktıkça sürekli olarak ayarlanıyor olabilir. Bir ressam, bir kameradan farklı olarak, sahnenin her bir parçasının gerçekte o konumda bulunan ve ona bakan birine benzediği bir görüntü üretebilir.
supercat

6

Zihinsel imajınız sadece retinanın değil, öğrenci ve elbette beyniniz de dahil olmak üzere görme ile ilgili diğer tüm bileşenlerle etkileşimi. Sana bir 'tek resim' olarak görünen şey, aslında tek bir anlık görüntünün değil, yüksek hızlı ayarların ve bilgi işlemenin sonucudur.

Bu konu hakkında daha fazla bilgiyi burada bulabilirsiniz .


1

Logaritmik özelliklere sahip bir ışık sensörü yapmak tamamen mümkündür - böyle bir sensör, belirli bir pozlama için sınırlı çözünürlük pahasına inanılmaz dinamik aralığa sahip olacaktır. Her ikisini de elde etmek için yüksek çözünürlüklü bir ADC gerekir. CT görüntülemede tipik olarak 24 bit doğrusal kullanılır - ve sonra CT görüntüsünü oluşturmak için ofset ayarlamasından sonra logaritma alınır.

Hem pozlama kontrolünü (entegrasyon süresi - düşünme deklanşör hızı) yapan bir sensör daha iyi yapabilir ve ışık toplama verimliliğinde değişikliklere izin verirseniz (f sayısı düşünün) daha fazla esneklik elde edersiniz.

Nihai dinamik aralık genellikle okuma gürültüsü ile sınırlıdır - biriken şarjı okuduğunuzda, bir miktar hata olacaktır - elektronik cihazların destekleyebileceği en büyük sinyale karşı. Dediğim gibi - 24 bit tıbbi görüntülemede yaygındır ve bu 10 milyonda 1 bölümden daha iyidir. Bu, belirli bir pozlama için retinadan çok daha yüksek bir dinamik aralıktır. Ancak, geleneksel kameralarda yaygın olarak kullanılmaz, çünkü göz görüntüdeki bu ayrıntıları takdir edemezdi ve çözünürlük hız pahasına gelir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.