Resim PDF dosyasını resim olarak nasıl kaydederim?


33

Belgenin tarama görüntüsünü içeren bir PDF'im var. Bu PDF'nin içeriğini bir resim olarak kaydetmek istiyorum, böylece sadece .jpg, .png ve .gif tipi dosyaları kabul eden bir OCR programında çalıştırabilirim.

Bu PDF'yi bu görüntü biçimlerinden birine nasıl kaydeder / dönüştürürüm?

EDIT: Bunu yapmak için bir yol buldum her sayfaya tıklamanız. Panoya kopyala. Paint.net'e yapıştırın ve kaydedin. Ancak, bu görünüşte zahmetlidir, Acrobat Reader'da bir seferde yalnızca bir sayfa seçebilirsiniz.

Yanıtlar:


20

Lütfen syorke'nin cevabının gerçekte bu özel problem için nasıl daha iyi bir cevap olduğuna dikkat çektiği yoksulyorick'in cevabına dikkat edin .


GhostScript kullanın . Bu komut benim için çalışıyor:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

Renk derinliğini farklılaştıran çoklu png sahte cihazları vardır: pngmono, pnggray, png16, png256, png16m ve pngalpha. Hangisinin size en uygun olduğunu seçin.

Ayrıca jpeg kullanabilirsiniz, ancak bir disk alanı sorununuz yoksa, OCR'niz için yönetebileceğiniz kadar yüksek bir kalite istiyorsunuz ve bu da jpeg değil.

GhostScript artık gif desteğine sahip değil, png256 desteğinde neye ihtiyaç duyduğunuzu bilemiyorum.


GhostScript'i seviyorum ve seçenekleri ayarlamak, görüntülemek vb. İçin bir GUI'nin rahatlığını istiyorsanız, GSview pages.cs.wisc.edu/~ghost/gsview
Dennis

Çıktı muazzam bir görüntü olacak mı?
Xonatron

1
@ Xonatron: Hayır. Sayfa başına bir görüntü. %dÇıktı dosya adında sayfa numarası ile değiştirilir bir değişkendir. (Neredeyse kesinlikle ham sayılardır, PDF içindeki sayı değildir.)
wfaulk

20

Imagemagick'i yükleyin . Bir cmd penceresi veya terminal açın:

convert myfile.pdf myfile.jpg

Çıktı pdf, test-0.jpg, test-1.jpg, vb. Sayfalardaki her sayfa için 1 jpg dosyası olacaktır.


ImageMagick için +1, yanlış iş için önermek için -2. JPEG fotoğraflar için iyidir, ancak keskin görüntülere ve yüksek kontrastlara sahip olduğunuzda (en çok beyaz arka plan üzerinde siyah metin / karakterlerde olduğu gibi) kullanmanız en kötü biçimdir. Ayrıca, ImageMagick dönüşüm işini kendisi yapmaz, arka plandaki Ghostscript'i “temsilci” kölesi olarak kullanır. Bu yüzden Ghostscript ile doğrudan yapmak size kullanılan parametreler üzerinde daha fazla kontrol sağlar. Ve sonra aşkına, TIFF (JPEG değil) çıktı formatı olarak seçin!
Kurt Pfeifle

1
Pencerelere dikkat edin, önce 32-bit Ghostscript'i yüklediğinizden emin olun.
Kullanıcı

2
Farkında olun density, depthve qualitysize yardımcı olabilir bayrakları senin çıkışını optimize eder. Örneğin: convert -density 300 -depth 8 -quality 85 a.pdf a.png Daha fazla bilgi
Nick,

13

Orada da pdfimagesgelen Xpdf araçları (edinilebilir XpdfReader yerinde ). Tüm PDF sayfasını bir resme dönüştürmez, bunun yerine gömülü görüntüleri bir PDF'den alır.

PDF metin ve görüntüler içeriyorsa ve yalnızca görüntüleri istiyorsanız bu özellik kullanışlıdır. Ayrıca, görüntüleri orijinal formatlarında çıkaracak, böylece kalite kaybı söz konusu olmayacaktır (tüm sayfayı oluşturan ve daha sonra örneğin JPEG formatına dönüştüren programların aksine). İhtiyaçlarınıza bağlı olarak bu yararlı olabilir.


Basit kullanım:

pdfimages -j -list mydocument.pdf mydocument-images

Bu giriş dosyasını okuyacak mydocument.pdf, tüm görüntüleri ayıklamak ve bireysel dosyalar adlı bunları yazmak mydocument-images-0000.jpg, mydocument-images-0001.jpgvs.

Seçenek -j, gömülü JPEG sıkıştırılmış görüntüleri PBM / PGM / PPM dosyaları (sıkıştırılmamış ve çok büyük) değil, JPEG dosyaları olarak yazmasını sağlar. PDF giriş dosyasında böyle saklandıysa, görüntülerin hala PBM / PGM / PPM dosyaları olarak yazılabileceğini unutmayın.


Başvuru için, basit kullanım olup pdfimages -j "yourinputfile.pdf" "outputimages"(bunlar doğru biçimi eğer veya "outputimages-0000.jpg") "outputimages-0000.ppm" yapacak. .NET örnekleri buradan veya buradan
aşılanabilir

Bir uyarı, dosyayı JPG olarak kaydedemeyebileceği, bunun yerine bir PPM
olabileceğidir

11

Adobe okuyucusu kullanarak bunu yapabilirsiniz:

  1. Resme tıklayın. Vurgulanacaktır.
  2. (Ctrl-C) kopyalayın ve Paint'e yapıştırın.
  3. İstediğiniz herhangi bir dosya türü olarak kaydedin.

2
Adobe Reader’ın, anlık görüntü aracıyla çekilen görüntülerin dpi’sini geçersiz kılma ayarı vardır, 300dpi olarak ayarlandığında, yazdırmaya hazır olan anlık görüntüleri elde edersiniz (varsayılan olarak ekran çözünürlüğü alınır, genellikle çok düşüktür). başka işlerde tekrar kullanım için)
Stijn Sanders

3
Sadelik için +1. Çoğu PDF okuyucu bunu yapmanıza izin verir.
Decio Lira

4
PDF'nizde 10000 sayfa resim varsa? Bunu 10000 kere yapmak zorunda mısın?
Guy

9

Pdfimages'den bahseden cevap dışında, diğer tüm cevaplar çözümlerinin aslında gömülü görüntüleri dönüştürdüğünden bahsetmiyor. Yani, bu çözümler, orijinal görüntüyü basitçe çıkarmakla kalmaz, işlem sırasında muhtemelen görüntünün zararına göre değiştirir. Yalnızca pdfimages orijinal resmi çıkarır. Bu, Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Önizleme ve diğer birçok PDF yazılımı için geçerlidir.


Sorunun bağlamı göz önüne alındığında, bu aslında çok iyi bir nokta.
wfaulk

FWIW, "PDFill PDF Tools", görüntü olarak kaydet için DPI değerini çok kullanışlı bir şekilde ayarlamanıza olanak tanır. Böylece her sayfa (metinden başlayarak, resimler, hangi nesnelerden olursa olsun), örneğin 4961x6520'de yüksek çözünürlüklü bir PNG'ye kaydedilir.
Chris O

4

PDFill PDF Araçları , muhtemelen PDF'lerinizi Windows'taki görüntülere dönüştürmenin en kolay yoludur. Görüntüleri tek seferde ayırmak için PDF'deki tüm sayfaları dışa aktarmanıza izin verir. Ayrıca, ticari veya "Pro" sürümünü satın alırsanız, yalnızca diğer PDF görüntüleyicilerde kullanılabilen, ücretsiz olarak sunulan birçok başka özelliği vardır.

Aşağıdaki ekran görüntüsünde "PDF'yi Görüntülere Dönüştür" düğmesini (düğme # 10) kullanın.

PDFill PDF Tools ekran görüntüsü

Görüntüleri çok yüksek bir görüntüde birleştirmeniz gerekirse, OCR programınıza yalnızca bir dosya beslemeniz gerekir, IrfanView'ü kullanabilirsiniz.


Bunun sisteminize iki farklı araç yükleyeceğini unutmayın. İhtiyacınız olmayan biri olan PDFill Editor. Bunu açmak için başlat menüsüne gidin. Kaldırmadan önce bir şeylerin yanlış olduğunu fark ederek ekran görüntüsünden kurtuldum.
59’da

Evet, sanırım bir PDF yazıcısının yanı sıra PDFill Editor'ın bir shareware sürümünü de yüklediğini söyleyemedim. Editör'ü 19.99 dolara satın almadığınız sürece, PDFill Editor ile oluşturulan dosyalar filigran içerecektir, ancak PDFill PDF Tools Free yardımcı programı herhangi bir satın alma gerektirmez. Sahip olduğum sürümde, PDFill Editor'ı PDFill PDF Tools Free'yi de kaldırmadan kaldıramazsınız, ancak PDFill Editor'ı yüklemek hiçbir şeye zarar vermez.
rob

2

Bir OS etiketi eklemediğiniz için bir OSX cevabı ekleyeceğim:

Varsayılan olarak PDF'ler, kullanmanızı sağlayan Preview.app’de açılır File -> Save-As:

  • GIF
  • ICNS
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • Photoshop
  • PNG
  • TGA
  • TIFF

1

Ayrıca PDF Xchange Viewer (Ücretsiz) , dosyaya verme işlemini gerçekleştirir. Dosya → Dışa aktar → Görüntüye dışa aktar.

Sadece bu değil, aynı zamanda Windows için en iyi ücretsiz PDF görüntüleyici olduğunu düşünüyorum ve bazı iyi biçimlendirme yeteneklerine sahip. Adobe Acrobat için bir lisansım var ve nadiren de olsa kapsamlı bir düzenleme yapmadığım sürece hala bunu tercih ediyorum.


Bu, ümit verici görünüyordu, görüntüye aktarma seçeneğinin parola korumalı PDF'ler için devre dışı bırakıldığını keşfedene kadar.
Mitch,

1

(Ücretsiz) Acrobat Professional şunları yapar:

Gelişmiş-> Doküman İşleme-> Tüm görüntüleri dışa aktar ...


0

Dosya 5 MB’den azsa ve gizlilik / gizlilikten endişe duymuyorsanız, http://www.go2convert.com/ adresinde çok sayıda grafik dönüştürme işlemi yapabilen kullanışlı bir çevrimiçi hizmettir (pdf - jpeg dahil)


Sadece denedim ve bu hata iletisini verdi "Üzgünüm! Bu resim doğru şekilde dönüştürülemedi."
Guy

-1

Görüntü ekranınızın boyutunu aşıyorsa, FastStone Capture ("Capture Scrolling Window") özelliğini kullanabilir ve görüntüyü JPEG olarak kaydedebilirsiniz.

alt metin


Bu bir görüntü yakalamanın çok dolambaçlı bir yoludur. OP'nin daha iyi bir çözümü var (Acrobat'taki sayfayı işaretleyin).
sleske

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.