Gerçekçi görüntü oluşturma: İnsan gözü ve beyninin hangi süreçlerini göz önünde bulundurmam gerekir?


12

Fotogerçekçi görüntü oluşturma , gerçek bir kameranın yakalayacağı şekilde bir görüntü oluşturma amacına sahiptir . Bu zaten iddialı bir hedef olsa da, belirli senaryolar için daha ileri götürmek isteyebilirsiniz: insan gözünün yakalayacağı veya hatta insanın algılayacağı bir görüntü oluşturun . Buna visiorealistik veya algısal- gerçekçi render diyebilirsiniz , ancak herhangi biri daha çekici bir terim ortaya çıkarabilirse (veya bana zaten var olan bir tane olduğunu söylese ) bunu takdir ediyorum.

İşte benim açımdan ifade etmek için bazı örnekler. Düşük aydınlatma seviyesinde bir kamerayla fotoğraf çektiğinizde ya iyi bir lensiniz olur ya da gürültülü bir görüntü elde edersiniz. Bir insan gözlemci için, skotopik görme devreye girer ve Purkinje etkisine yol açar (renkler maviye doğru kaydırılır). Bu efekt, görüntüyü bir LDR ekranda görüntülediğimde kaybolan HDR parlaklık bilgilerine bağlıdır. Buna ek olarak, insan beyni algılanan görüntüyü - son (stereo olmayan) bir renderde kaybolan bilgileri 'filtrelemek' için derinlik bilgisini kullanabilir.

Kapsamlı bir liste oluşturmak muhtemelen zor bir hedeftir. Göz ve beynin dikkate almam gereken bazı etkilerini önerebilir misiniz?


Bir kez duydum, kameralarla aynı gürültüyü elde ediyoruz çünkü gürültü aslında fiziksel değil, sadece elektrik değil. (yani sonuçta çok fazla foton yok). Ancak beyin, geçici antialiasing kullanarak bunu siler. (yani gece hareket bulanıklığı çok görüyoruz).
v.oddou

Fikri tam anlamıyorum. Düşük ışıkta bir görüntü oluşturursanız ve bir Purkinje efekti simüle ederseniz, insan gözü kendi efektini ekleyeceğinden gerçekçi görünmez, değil mi?
Yves Daoust

1
@Yvesdaoust Görüntü bilinmeyen aydınlatma koşullarında bir LDR monitörde gösterildiğinden, muhtemelen değil. Basitçe söylemek gerekirse, ekranda gördüğünüz görüntü daha parlak olur, böylece algılanması daha kolaydır. Bir HDR monitör kullanıyor olsaydık ve bir gece sahnesinin parlaklık değerlerini tam olarak üretebilseydik (ve aksi halde karanlık bir odanız varsa), haklısınız.
David Kuri

1
Ne için uğraştığınla ilgili yanlış bir şey yok, ama korkmamalıyım ki, bu benim için biraz geniş görünüyor, çünkü dikkate almamız gereken birçok efekt var. Bunu SE formatında yazamadım, çünkü gerçekten yanlış olurdu. Ancak kapsamınızı " Göz önünde bulundurmam gereken bazı efektleri önerebilir misiniz? "
joojaa

@joojaa Soruları önerdiğin gibi değiştirdim, teşekkürler.
David Kuri

Yanıtlar:


5

daha da ileri götürmek isteyebilirsiniz: insan gözü onu yakalayacağı gibi, hatta insan onu algılayacağı şekilde bir imge yaratın.

Bunu yorumlamanın iki yolu vardır. Ben ikisini de yapacağım.


Yorum 1: Algısal olarak gerçekçi görünen bir görüntü oluşturun.

Günün sonunda, resminizin hala bir yerde gösterilmesi gerekiyor. Anahtar: görüntünüzü belirli bir görüntü aygıtında * görüntülediğinizde *, orijinal radyometrik görüntünün ürettiği hissi üretecek şekilde oluşturmak istiyorsunuz.

Bu fikri nasıl açacağınız aşağıda açıklanmıştır.

Gerçek dünyada, radyometrik spektrumlar (yani ışığın gerçek dağılımları) gözünüze girer ve yaklaşık 1 dört ışık reseptörünü uyarır . Reseptörlerin stimülasyonları, görüntülerle ilişkilendirdiğimiz renk hislerini üretir.

Render yaparken, ürettiğimiz spektrumlar üzerinde keyfi bir kontrole sahip değiliz. Neyse ki, (genellikle) her biri sadece skaler değer üreten sadece üç koniye sahip olduğumuzdan, renk görme tam olarak üç primer kullanılarak çoğaltılabilir. Sonuç olarak, sadece üç dalga boyunun doğrusal bir kombinasyonunu kullanarak herhangi bir renk hissi üretebilirsiniz (negatif olması gerekebilecek birkaç renge kadar, bu durumda sadece farklı primerler kullanırsınız).

Primer seçeneğiniz yok. Hemen hemen tüm renkli ekran cihazları, üç primer sağlayan (aslında genellikle tek bir dalga boyuna sahip olmayan) sRGB standardını kullanır. Bu iyi çünkü her şey soyutlanmış ve umursamanız gerekmiyor.

Algısal olarak doğru renderleme karmaşasını netleştirmek için algoritma:

  1. Doğru radyometrik hesaplamaları kullanarak görüntünüzü oluşturun. Tek tek ışık dalga boylarını veya dalga boyu kovalarını izlersiniz. Her neyse. Sonunda, her noktada alınan spektrumu temsil eden bir görüntünüz var.
  2. Her pikselde, oluşturduğunuz spektrumu alır ve onu CIE XYZ renk uzayına dönüştürürsünüz . Bu, spektrumun ürününü standart gözlemci işlevleriyle bütünleştirmektedir (bkz. CIE XYZ tanımı) .
  3. Bu, CIE XYZ renkleri olan üç skaler değer üretir.
  4. Bunu doğrusal RGB'ye dönüştürmek için bir matris dönüşümü kullanın ve oradan doğrusal RGB'yi sRGB'ye dönüştürmek için doğrusal / güç dönüşümü kullanın .
  5. Kayan noktadan uint8'e dönüştürün ve değerleri aralık dışına sıkıştırın (monitörünüz bunları temsil edemez).
  6. Uint8 piksellerini çerçeve arabelleğine gönderin.
  7. Ekran sRGB renklerini alır, belirli yoğunluklarda üç primer üretmek için ters dönüşümü yapar. Her biri, sorumlu olduğu resim öğesinin çıktısını ölçeklendirir. Resim elemanları aydınlanır ve bir spektrum oluşturur. Bu spektrum (umarım) oluşturduğunuz orijinal spektrum için bir metamer olacaktır.
  8. Spektrumu, oluşturulan spektrumu algıladığınız gibi algılarsınız.

Yorum 2: İnsan gözünün görselleştirme veya LDR ekranları için telafi amacıyla alabileceği son verileri simüle etmeye çalışın.

Bunun daha az kullanışlı bir anlamı var sanırım. Esasen, beynin eğlence / kâr için algılama biçimini değiştiren bir görüntü üretmeye çalışıyorsunuz.

Örneğin, bu yıl SIGGRAPH'da, görüntüleri algısal olarak farklı görünmelerini sağlamak için görüntüleri ve renk azaltmayı simüle ettikleri bir kağıt vardı . Tabii ki, bunu yapmanın tek nedeni, birlikte çalıştığımız ekranların düşük dinamik aralık (LDR) olmasıdır. Buradaki nokta, birisinin gerçek bir yüksek dinamik aralık (HDR) görüntüsüne gerçek görüntü verileri olarak maruz kaldığında görebileceği etkileri simüle etmektir.

Uygulamada, bu çok iyi çalışmaz. Örneğin, sonraki görüntüler için, çok parlak bir uyarıcı tüketen renk hücreleri nedeniyle sonraki görüntüler görüyoruz. Bunun yerine, etkiyi sahte bir görüntü ile uyarmaya çalışırsanız, benzer görünebilir - ancak tamamen farklı bir mekanizma olduğundan, çok ikna edici değildir.

Bu tür grafikler, literatürde incelemek istiyorsanız aslında eksik incelenmiştir. Sözü edilen makale, sahip olduğumuz en son teknoloji yaklaşımların bir örneğidir. Bence şu anki fikir birliği, simüle etmeye (gerçekten de en azından şu anda) gerçekten değmeyecek olması, çünkü en iyi ihtimalle sadece farklı vizyonları değiştirerek gerçek görme etkilerine yaklaşıyorsunuz ve bu aslında iş.


1 Çubuk + 3 * koni, olağan durum. Yaklaşık olarak, insanlar tahmin edilen en fazla yedi taneye kadar sıfır fonksiyonel ışık reseptörüne sahip olabilir (şimdiye kadar gözlemlenen en yüksek değer beştir).


Cevabınız için teşekkürler. Yine de eksik olduğunu düşünüyorum. Yorum 1'deki ifadeniz "Spektrumu, oluşturulan spektrumu algıladığınız gibi algılarsınız" tartışmasız yanlıştır. Gerçek spektrumu algılarken, tanımladığınız dönüşümü kullanırken efektler işe yaramaz (örneğin Jameson, Hurvich: Görsel Psikofizik'te belirtildiği gibi düşük aydınlatma koşullarında bir skotopik standart gözlemci kullanmanız gerekir ). Açıkladığınız şey spektral render fikri. 2. yorum hakkında daha fazla şey öğrenmek istiyorum. Kağıt iyi bir başlangıç ​​olacak, bunun için teşekkürler.
David Kuri

4

Algı söz konusu olduğunda, neredeyse neye kör olduğumuz (özellikler veya eserler açısından) ve neyi algıladığımız meselesi de vardır.

Örneğin ses gelince, sizi diğer içeriklerden (veya dokuların örgü çözünürlüğünü nasıl maskeleyebileceğini gösteren eski bir SIGGRAPH kağıdı) artı her zaman ("körlüğü değiştir" için google) daha az veya farkında olmayan kontrast veya frekanslara sahipsiniz. Benzer şekilde, değerlere ve göreceli değerlere bağlı olarak yüzey, normaller, BRDF detayları görülebilir veya görülmeyebilir.

Ayrıca, algılama sistemimiz yerel ve küresel olarak uyum sağlama eğiliminde olduğundan, düşük frekans değerleri için doğru yerlerde maksimum ve minimum olması önemlidir, ancak kesin değerleri gerçekten fark edilmeyecektir.

Bazen biliş, bulutlarda ve ağaçlarda çok fazla hataya izin verdiğiniz gibi, ancak insan yüzlerinde kesinlikle daha az olabilir. (Bazen bunu belirli bir kategoriye ait parametre istatistiklerine eski sürüme geçirebilirsiniz.)

Bu yüzden "fotogerçekçi" yerine "mantıklı" kelimesini kullanmayı tercih ediyorum.

Aksine, yanlış pikseller veya titreyen pikseller gibi yapay nesnelere, yalnızca 1 gri düzeyindeki hata cepheleri, Moiré, takma ad veya kötü rasgele gibi istenmeyen desenler gibi korelasyonlara karşı ultra hassasız.

Bu arada, basit bir enerjide her şeyi toplayan optimizasyon tabanlı çözümlerin algısal olarak konuşan çok kötü bir fikir olabilmesinin nedenlerinden biri, çünkü tüm paradoksal durumlarda bu, çizgilerdeki veya noktalardaki hataların yoğunlaşmasına eğilimli olabilir. Aynı nedenden ötürü, erken küresel aydınlatma, insanlar, kesin enerji çözümlerinin kenar yumuşatılmış yaklaşık gölgelerden daha az kabul edildiğini hayal kırıklığına uğrattı (ve daha sonra dört ağaçtan ağ tabanlı uyarlanabilir yöntemlere geldi).

Grafik algısına ilişkin (oldukça genel) bir genel bakış, SigAsia'nın 11 “Grafik, Görselleştirme, Sanal Ortamlar ve Animasyonda Algılama” dersinde bulunabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.