Metin çekmek için en iyi kamera ayarları?


11

S95'imi OCR için metin belgelerini (kağıt ve mikrofilm) fotoğraflamak için kullanıyorum. Mikrofilm için bir bilgisayar ekranını en iyi nasıl fotoğraflayabileceğimi sormuştum, ancak metnin fotoğrafını çekmenin en iyi yolunu düşünüyorum, böylece metin net ve net çıkıyor. İşte şu anki düşüncelerim, ama benden daha fazla fotoğraf deneyimi olan herkesin söylemek zorunda olduklarını duymak isterim:

  1. Daha küçük bir megapiksel # kullanıyorum (S95'in maksimum değeri yerine yaklaşık 6-7MP, ki bu 10MP'dir), böylece gerçekten PDF dosyaları bilgisayarlarımı kaydırmaya gittiğimde bilgisayarımı öldürmez

  2. Açıklık - daha düşük (örn. F / 6.3), böylece kamera sayfaya tam olarak paralel değilse, metin odakta kalacaktır

  3. Enstantane hızı - Burada bir ödünleşim var, çünkü kütüphaneler genellikle daha düşük ışıktadır, bu nedenle enstantane hızını arttırmak için pozlamayı azaltmak istiyorum, ancak bir tripod olmadan, kamera sallanması olasılığı vardır

  4. ISO - Bunun nasıl etkileyeceğinden tam olarak emin değilim.

  5. Beyaz Dengesi - Yine, tam olarak emin değilim.

Fotoğraf makinemde farklı ayarlarla denemeler yapıyorum, ancak sadece fotoğrafçılığı öğreniyorum ve herkesin kitaplardan veya belgelerden metinlerin en iyi nasıl fotoğraflanacağına dair herhangi bir önerisi olup olmadığını bilmek istiyorum, okunması kolay.


3
Neden sadece iş için doğru aracı ve bir tarayıcı kullanmıyorsunuz?
ahockley

7
"Neden sadece iş için doğru aracı ve bir tarayıcı kullanmıyorsunuz?" - Çünkü birlikte çalıştığım belgelerin çoğu taranamıyor. Ya çok kırılgandırlar ya da kütüphane taramanıza izin vermez ya da kütüphane fahiş masrafları $ 0.50 / sayfa yukarıdan taramak için ücret alır.
Jason,

2
Bunun söylenmesini isterim: Umarım kullanımlarınız, uygunsa ve uygunsa telif haklarına uygun şekilde saygı gösterir. :) Öyle ki, umarım cevaplarını bulursun!
lindes

3
"Umarım kullanımlarınız telif haklarına uygun şekilde saygı duyar" - Evet, çalışmam telif hakkı kısıtlamaları dışındaki belgelerle (Ben bir tarihçiyim, çoğunlukla 19. yüzyılın sonlarında Avrupa'yı inceliyorum)
Jason

2
@ahockley: taramamanın bir başka nedeni de çok uzun zaman alması. DSLR ile bir masaüstünde dakikada yaklaşık 20 sayfa yapabilirim, ancak hızlı bir şekilde belge besleyici kullanan ve çok maliyetli bir tarayıcı.

Yanıtlar:


7

Kameranızın siyah beyaz modu varsa, işlem sonrası sürenizi kısaltmayı denerdim. Ayrıca, birlikte çalıştığım birçok OCR programı B&W'de çok daha iyi sonuçlar veriyor.

El ile tuttuğunuzda kamera sarsıntısını azaltmak için, muhtemelen deklanşör hızınızı en üst düzeye çıkarmak için en geniş diyaframa ihtiyacınız olacak. S95'inizdeki küçük sensör, DOF'unuzu diyaframı olabildiğince açabileceğim kadar arttırmalıdır.

Bunu sadece OCR ile çalıştıracağınız düşünüldüğünde, ISO'nuzu size minimum sarsıntı ile uygun bir pozlama sağlayana kadar çevirin. OCR'nin fazladan gürültüden şikayet etmesi, bulanık harflerden çok daha az olasıdır.

Beyaz dengesi, sadece metin hakkında konuşuyorsanız, kameranız için "iç mekan" ayarınız ne olursa olsun olmalıdır - ama açıkçası, bu konuda fazla endişelenmeyin.

Megapikselleriniz yalnızca belge metniniz inanılmaz derecede küçükse ve bu ayrıntı düzeyini açıkça çözmeniz gerekse önemli olabilir, ancak 6-7'nin çoğu şey için iyi olacağını tahmin ediyorum.


1
Muhtemelen "sayfaya dik" demek istediniz. Paralelseniz metni okumak zor olacaktır. ;-)
Craig Walker

@Craig Walker - sayfaya "paralel" terimlerini kullandı ve ne demek istediğini anladım, bu yüzden onu karıştırmaya çalışmıyordum. Vizörde olduğu gibi sensörün kendisinin de paralel olacağından bahsetmiyoruz. Bu sadece kameranızın referans aldığınız kısmına bağlıdır. Terim kasıtlıydı.
rfusca

Mümkün olan en fazla megapiksel kullanın, OCR'd belgeler önemlidir ve göreceli olarak küçük olacaktır ve kaynak tüm metin olduğu sürece, kamera çözünürlüğünden etkilenmez. Abbyy FineReader kullanıyorum ve daha yüksek çözünürlüklü görüntülerde daha iyi çalışıyor (örneğin, 10MP yerine 21MP). 10MP'de çekim yapın.

yeterince adil.
Craig Walker

S / B modu için +1. Metin işleme için RGB pikselleri boşa harcıyor.
Greg

2

Ayarları zaten iyi biliyorsunuz. Kamera sarsıntısı metnin okunabilirliğini her şeyden daha fazla mahvedecek, bu yüzden önce onu optimize ederim. Bir üçayak kullanamıyorsanız, enstantane hızınızın odak uzaklığınızın (35 mm eşdeğeri) üzerinde en az 1 olduğundan emin olun. Uzaklaştırmak bunu kolaylaştırır. Varsa görüntü sabitleme özelliğini kullanın.

Diyafram oldukça geniş ayarlanabilir, sadece sayfaya paralel olduğunuzdan emin olun. Geniş bir diyafram obtüratör hızına yardımcı olur, yine geniş diyafram nedeniyle bulanıklık kamera hareketinden kaynaklanan bulanıklık ile karşılaştırıldığında hiçbir şey değildir!

ISO, iyi bir pozlama elde etmek için neye ihtiyacınız varsa. Gürültü, gerçekten kötüleşene kadar okunabilirliği etkilememelidir.

Kağıdın kendisine göre özel bir beyaz dengesi çekmek tercih edilebilir, ancak OCR yazılımı kirli beyaz bir arka planla başa çıkabilmelidir.


1
  1. JPEG'leri PDF'lere dönüştürdüğünüzü varsayıyorum. Maksimum değeri yakalamanızı ve küçülmeden sonra ve PDF'ye dönüştürmeden önce uygulanan keskinleştirme ile 6-7 MP'ye küçültmek için bir program kullanmanızı öneririm.

  2. Açıklığa kavuşturmak için, daha geniş alan derinliği için daha yüksek bir f-stop sayısı olan daha dar bir diyafram açıklığı istiyorsunuz. (örneğin f / 2 yerine f / 8 istiyorsunuz). Okunabilirlik için metinle, alan derinliği konusunda endişelenmenize gerek kalmadan kameranın olabildiğince dik olmasını sağlayın. CA gibi beyaz metinlerde siyahla göreceğiniz sapmaları azaltmak için geniş açıklıktan biraz durmak iyi bir fikirdir. Kağıda ne kadar yakın olursanız, alan derinliği o kadar sığ olur.

  3. Elde tutuyorsanız, muhtemelen okunabilirlik üzerinde en büyük etkiye sahip olacaktır. Tutacaksanız, 1 / (eşdeğer 35mm odak uzaklığı) veya daha da hızlı olacak şekilde bir obtüratör hızı seçmek istersiniz. Bu, P&S'nizde hangi yakınlaştırma ayarını kullandığınıza bağlıdır. Geniş ucu kullanırsanız, daha uzun obtüratör hızlarıyla uzaklaşabilirsiniz, ancak namlu bozulmasına neden olabilir. Bilgisayar ekranını değil metin belgelerini fotoğraflıyorsanız, flaş denemenizi öneririz.

    Yapabiliyorsanız, belgeyi yukarı kaldırın (bantlanmış veya düz olması için bir şey), böylece kamerayı bir şeye yaslayın ve istediğiniz kadar enstantane hızı elde edin. Ayrıca, kamerayı yerine oturtmak için bir puf veya küçük nesneler de kullanabilirsiniz. Ayrıca, bir P&S için su şişesi tripod adaptörleri alabilirsiniz.

  4. Diyafram, enstantane hızı ve ISO bir pozlama üçgeni oluşturur. Burada okuyun . ISO ne kadar yüksek olursa, kullanabileceğiniz daha dar diyafram ve daha düşük deklanşör hızı, ancak görüntü daha gürültülü olacaktır. Metinli bir P&S için düşük ISO (400 veya daha az) öneririm.

  5. Aydınlatma durumunuz için beyaz dengesini seçin. Floresan varsa bunu kullan. Flaş kullanıyorsanız, flaş beyaz dengesini kullanın.


F / 8'in iç mekanlarda çekim yapmak için gerçekçi olduğunu düşünmüyorum (flaş kullanmadıkça, önce kütüphaneden izin istemeniz gerekir) artı f / 8, küçük bir sensörle dikkat dağınıklığına neden olacak, keskinlik kazancı en az deklanşör süresi / ISO'daki gerekli artışa kıyasla.
Matt Grum

@Matt f / 8, alan derinliğini artırmak (ve CA gibi görünür olabilecek diğer sapmaları azaltmak) için daha yüksek bir sayı istediğini gösteren bir örnektir. Ne kadar ışığa sahip olduğundan emin olmadığım için ona rehberlik etmedim. Dikkati başka yöne çekme? Kırınmayı mı kastediyorsun?
Eruditass

Evet kırınım demek istedim - Bunu, doğru bir şekilde hecelediğimde bile kelimelerimi otomatik olarak düzeltme alışkanlığına sahip olan telefonuma yazıyorum. CA büyük bir sorun olmayacak (kamera sarsıntısına kıyasla), sanırım ışık büyük bir sorunsa, geniş açıktan bir duraksamış olursunuz ...
Matt Grum

Teknolojiyi sevmiyor musun? Evet, açık bir noktadan bir durağın iyi bir rehber olduğunu söyleyebilirim ve kamera sarsıntısının en önemli şey olacağı konusunda hemfikirim.
Eruditass

Bu, maksimum MP'lerle çekim yapmak için gerçekten iyi bir öneri ve daha sonra bilgisayarda aşağı örnek. Keskinleştirme + ekstra kontrastın daha net metinlere, daha kolay okunmasına yol açacağını hayal edebiliyorum.
Jason,

1

Bilgisayarda mevcut olan en yüksek çözünürlükte ve küçültme için önerileri kabul ediyorum. Ayrıca, kameranızdan alabileceğiniz en yüksek kaliteli jpeg'i seçin, hatta kameranız izin veriyorsa çiğ çekim yapın ve bir tiff veya png'ye dönüştürün. Jpeg'deki kayıplı sıkıştırma, mürekkep / kağıt sınırı etrafında ocr yazılımınızı karıştırabilecek yapay nesneler oluşturabilir.

Genel olarak, yapmak istediğiniz en net görüntüyü elde edecek ayarları kullanmaktır. Kontrast, beyaz dengesi vb. Şeylerin tümü bilgisayarda değiştirilebilir. Aslında, düzey aracını veya photoshop veya GIMP'deki kontrast / parlaklık aracını kullanarak kontrastı artırmak size çok yardımcı olabilir.

Ayrıca, gri tonlamalı formata dönüştürmek dosyalarınızın boyutunu önemli ölçüde azaltır. Ve bunu yaparsanız ve kontrastı arttırırsanız, beyaz dengesi hakkında endişelenmenize gerek yoktur. Beyaz dengesini deneyebilirsiniz, ancak bazı ayarlar diğerlerinden daha iyi kontrast oluşturabilir (ışıklandırmanıza bağlıdır).

Bilgisayarınız bu sorunu çözebiliyorsa, küçültmeden önce ve küçültmeden sonra tüm ayarlamaları (gri tonlama, kontrast, parlaklık) yapın görüntüye bir miktar keskinleştirme filtresi uygulayın.


1

Karışıma eklemek için başka bir yerde fark etmediğim birkaç düşünce:

  • Eğer varsa ateş (diğer "yakınlaştırılmış" telefoto , bu daha sonra daha yakın olacak bir köşede boyut-of-metin (sözcüklere göre size daha tutarlı bir görüntü verecektir sayfasından daha fazla ateş neden olur) ortadaki kelimelerle aynı boyutta; geniş açılı olarak, buna göre bozulma yaşayabilirsiniz). Burada "ideal" ayarın ne olduğundan emin değilim ve bu, gerekli enstantane hızlarına karşı bir değiş tokuş, potansiyel olarak sadece düşünülmesi gereken bir şey.

  • Kameranızın muhtemelen varsayılan olarak doğru olduğunu düşündüğüne göre " aşırı pozlamak " isteyeceksiniz (bunun kağıt olduğunu tahmin etmek için yeterince akıllı olmadıkça - bunu tırnak işaretleri içine alıyorum çünkü gerçekten aşırı pozlamak istemiyorsunuz , beyaz bir sayfanın ölçülmesine bağlı olarak aşırı pozlama), çünkü birincil ton (kağıdın kendisi) fotoğraf makinesinin göstermeye çalıştığı ana şey olacaktır ve kağıdı orta gri olarak ortaya çıkarırsanız, bir çamurluk başlangıç ​​noktası. Bir buçuk ile 2 durak arasında "aşırı pozlama" yaparsanız (kırpma kırpma noktalarına gitmeyin), metin yine de güzel ve karanlık olmalı, ancak kağıt güzel ve parlak olacak ve kontrast ayrımları yapacak ( ve böylece OCR) daha kolay.

  • hatta ışıklandırmaya çalışın - sayfanın bir köşesi diğerinden çok daha açık veya koyu ise, bu durum OCR amaçları için büyük olasılıkla isteyeceğiniz saf siyah ve saf beyaza ayrılmayı zorlaştıracaktır.

  • bir "kopya standı" bu tür projeler için idealdir, ancak kütüphanede kolayca sahip olabileceğinizin ötesinde olduğunu düşünüyorum ... Ancak, kitaplığınızın yapılandırılma şekline bağlı olarak bir yerde olabilir (belki de bir raf Masa başı veya aydınlatma veya benzeri bir çubuk tutan?) bir top kafalı bir süper kelepçe yerleştirebilirsiniz ( burada bir tane , ancak uygun büyüklükte (başa bağlı olarak) "saplama" ve bir çeşit tripod içeren herhangi bir süper kelepçe kafa yapar) ve kameranız daha sonra masanın (veya herhangi bir şeyin) yüzeyinin üzerine monte edilir, böylece daha uzun pozlamalara ihtiyaç duymanız durumunda tutarlı konumlandırmaya ve dengeye sahip olabilirsiniz. Temel olarak, bu bir "fakir adamın" kopya standı anlamına gelir.

    Ayrıca , kamera sarsıntısının düğmeye basmasını önlemek için kısa bir otomatik zamanlayıcı veya uzaktan kumanda (kameranızın 2 saniyelik bir otomatik zamanlayıcı modu ve belki de daha kısa olabilen özel bir zamanlayıcı olduğunu düşünebilirsiniz) kullanmak isteyebilirsiniz.

Şimdilik tek düşündüğüm bu. Umarım bu yardımcı olur.


1

Ben senin kara adam fotoğrafı ile aynı işe sahibim ve yıllarca yaptım. İnsanların çoğu ne hakkında konuştuklarını bilmiyor, güven bana !!!

  1. M veya manuel kamera

  2. ISO 100-200 daha parlak # ne kadar yüksekse, ancak resimde daha fazla tahıl veya gürültü var

  3. Deklanşör hızı 1/100 ila 1/160 (genellikle 1/125 en iyisidir, daha parlak daha düşüktür, ancak daha fazla buries veya tekrar alırsınız)

  4. Diyafram veya f2.7 (neden düz bir sayfa olan derin bir görüş alanına ihtiyacınız var)

  5. Renkli çekim yapın, 6 ila 10 megapiksel, beyaz dengesi ayarlarınıza bakın, genellikle 1 veya 2 floresan, çanların çoğunu kapatın ve eğer Ur emin değilseniz kapatın

  6. acdc kullanarak comp fotoğraflarını açığa


0

Bazı küçük öneriler, ancak kurulumunuzun iyi göründüğünü düşünüyorum

  1. Bir tripod kullanın. Bu, kamera titremesiyle ilgili sorunları ortadan kaldıracak ve ihtiyacınız olduğu kadar uzun süre pozlama kullanmanıza izin verecektir.

  2. Doğrudan lense yansıyabilecek bir açıda kağıda doğrudan düşen ışıktan kaçının ve istemediğiniz yerde bir vurguya neden olun. Bu genellikle ışığın yanlardan geldiğinden emin olmak anlamına gelir.

  3. ISO: Temel bir kural olarak, daha düşük bir değere doğru hata yapmalısınız, ancak eminim ki herhangi bir maddi fark hızla ortaya çıkacaktır.

Bunun dışında, kurulumunuzu iyileştirmenin herhangi bir yolunu düşünemiyorum. Dürüst olmak gerekirse, sanırım anladınız.


Yararlı olacak iyi (ve nispeten ucuz) bir tripod önerebilir misiniz ve fotoğraf makinesini, fotoğrafladığım sayfalara paralel olacak şekilde ters çevirmeme izin verir misiniz? Joby tripodlarına baktım ve umut verici görünüyorlar, ancak deklanşöre bastığınızda sık sık değiştiklerini duydum.
Jason

@ Jason, adil bir nokta. Sevdiğim bir Joby'im var, ancak deklanşöre bastığınızda hareket etmesini durdurmak için uzaktan deklanşör kullanın veya otomatik zamanlayıcı kullanın. Bu, düşük deklanşör hızı kullandığınız her zaman için iyi bir ipucu. Kötü haber, çok kararlı olacak kadar ağır olan herhangi bir tripodun ucuz olmayacağıdır. Bunun için üzgünüm! (Farklı bulursanız, bana bildirin!);)
AJ Finch

0

Cevapların çoğuna zaten sahip olduğunuz anlaşılıyor :-P Noktalarınıza birkaç yorum ekleyeceğim:

  1. Çözünürlük: haklısınız, özellikle de görüntüleri ekranda izleyecekseniz, burada çok fazla çözüme ihtiyacınız olmayacak. Muhtemelen en yüksek tipik ekran çözünürlüğünün iki katını kendim yakalarım.

  2. Diyafram: biraz alan derinliği kıpır kıpır odasına girmek için daha küçük bir diyafram seçerek haklısınız. Ancak, muhtemelen çok fazla şeye ihtiyacınız olmayacak. Odak uzaklığınız için alan derinliği hesaplayıcı ile oynayın, makul bir DOF bulun ve sonra yapabileceğiniz en büyük diyafram ile gidin. (Bununla birlikte, en iyi netlik için maksimum diyafram açıklığınızın altında bir veya iki durak olduğunuzdan emin olun.) Deklanşör ve ISO ile oynamak için daha fazla alana sahip olabilmeniz için en büyük diyaframı istiyorsunuz; aşağıya bakınız.

  3. Deklanşör: Açıkçası, yeterli ışık alırken, sallanmayı azaltmak için mümkün olduğunca hızlı olmasını istiyorsunuz. Çeşitli kaynakların sallanmayı önlemek için "odak uzaklığına eşit enstantane hızı" iddiasını duydum; bazıları iki katına çıkar. Bu nedenle, 50 mm'lik bir lens kullanıyorsanız, obtüratör hızını 1/50 ve 1/100 arasında tutmaya çalışın. Bunu yaptıktan sonra, ışığı en üst düzeye çıkarmak için en düşük hızı deneyin.

  4. ISO: Bunu oldukça yükseğe çıkartabilmelisiniz. Gürültü resmin görünümünü azaltabilir, ancak muhtemelen okunabilirliğini çok fazla düşürmez. "Yüksek ISO" ve "çok gürültülü" kameranıza bağlıdır. Deney. Bu muhtemelen diyafram ve deklanşöre kıyasla düşük ışıkta doğru pozlama elde etmenin en iyi yoludur.

  5. Beyaz Dengesi: sizin için çok önemli değil. Fotoğrafladığınız kağıdın kirli beyaz görünmesi sorun yaratır mı? (Tabii ki tam renkli resimlerle kitap çekiyorsanız farklı hikaye). Postayla düzeltmek istiyorsanız, çalışmak için çok sayıda nötr renkli kağıdınız olduğu için nispeten kolay bir zamanınız olacak. Muhtemelen kameranızı Otomatik Beyaz Dengesi'nde bırakıp unuturdum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.