Taranan sayfalardan * oluşturulan PDF'leri otomatik olarak nasıl yeniden çarpabilir ve kırpabilirim? [çiftleme]


13

Olası Çoğaltma:
Taranan görüntüleri yeniden çarpıtmak için hangi özgür yazılımı kullanabilirim

Kitap sayfalarının taramasından oluşan birkaç PDF'im var. Taramalar bir seferde iki sayfadan yapılır ve bu taramaların bazıları eğrilir, böylece metin hafifçe eğik görünür.

Okunabilirliği kaybetmeden taramaları düzelterek otomatik bir optimizasyon yapmama izin verecek bir araç arıyorum. GPL yazılımı Briss , 2: 1 yerine 1: 1 sayfa oranına sahip olmak için taramaları kırpmak için buldum , ancak sayfaları yeniden çarpıtmak için herhangi bir aracım yok.

Yapmak istediğim şey için mükemmel görünen başka bir açık kaynak aracı olan kağıdın üzerine tökezledim , ancak bu araç sadece Linux ve doğrudan PDF dosyalarında çalışmıyor.

Herhangi bir ipucu takdir.


1
@random: Bu soru neden kapatıldı ?? Bu konu neden 'tartışma, tartışma, oylama veya genişletilmiş tartışma' talep etmeli?!?
Kurt Pfeifle

1
"bir araç arıyor" hizmetler için hemen hemen yoklama yapıcı değil yakın neden yol açar @kur
rastgele

1
@random: Bu soru beni konu hakkında biraz araştırma yapmaya itti ve ikna etmek için bazı ilginç seçenekler buldum. En ilginç olanı bunun için ImageMagick kullanıyor ve şaşırtıcı derecede basit görünüyor. Maalesef bunu kapatmanız cevabımı göndermeme izin vermiyor.
Kurt Pfeifle

@random: Şimdi soruyu biraz düzenledim. Umarım şimdi 'yapıcılık' anlayışınıza daha uyumludur.
Kurt Pfeifle

@random: Tamam, bu durumda 'kopya olarak kapatma' benim için daha iyi kabul edilebilir.
Kurt Pfeifle

Yanıtlar:


9

Göz at Eğrilik Düzeltme . Bu bir komut satırı aracı. İndirme * zip dosyası Windows, MacOSX ve Linux için ikili dosyalar içeriyor gibi görünüyor.

Lisans ne olursa olsun MPL (Mozilla) veya LPGL'dir (GNU).

Sizin için tek dezavantajı, PDF'leri değil, sadece PNG ve TIFF görüntülerini (AFAICS) tüketmesidir. Bu, s.th. iş akışı ayarlamanız gerektiği anlamına gelir. sevmek:

 PDF.orig -> PNG.orig -> PNG.deskewed -> PDF.deskewed

Kendimi test etmedim (henüz), yakın zamanda web sitesine rastladım ve yer imi koydum.


deskewtest çalışmamdaki döndürmeyle ilgili bozulmayı düzeltmeyi başardı ancak maalesef orijinal görüntü kenarlığı konumunda ince gri bir çizgi oluşturdu. Gri kenarlıktan kurtulmak için görüntüleri -extentseçeneği ile kırptım mogrify. Sadece OS X'te test ettim, belki de bu yanlış davranış platforma özgüdür.
Stefan Schmidt

deskewgerçekten iyi çalışıyor. İş akışım şöyle : pdfimages -all <pdf> my_imagesjbig2 -s -p -v my_images* > outputpdf.py output > deskewed.pdfSiyah kenarlıklar ( masaüstü düzeltme işleminin sonucu) sizi rahatsız ediyorsa, @StefanSchmidt
Bay Tao

5

Bir cevap daha ekleyeyim. Sadece netpbm'i hatırladım . Yıllarca kullanmadım, ama sanırım yeni bir bakış atmalıyım ...

netpbm, grafik görüntülerini işlemek için komut satırı için çok güçlü bir araç setidir. Yaklaşık 300 ayrı alet sevk eder. Yaklaşık 100 grafik formatı için dönüştürücüler içerir.

Ayrıca, görüntüleri döndürebilen bir komut satırı aracına sahiptir:

pnmrotate

Ve döndürülmüş görüntülerin açısını keşfetmeye çalışan başka bir aracı var:

pamtilt

pamtiltgörüntü döndürme tahmininin kayan bir sayısını döndürür. Bu nedenle görüntülerin otomatik olarak kaldırılması erişilebilir olmalıdır. Bunu yapmak için bir kabuk betiği yazılabilir. Farklı adımlar gerektirir:

  1. Ghostscript yardımıyla PDF sayfasını netpbm uyumlu bir görüntü formatına dönüştürün.
  2. Görüntünün pamtilteğim açısını otomatik olarak keşfetmek için kullanın .
  3. pnmrotateGörüntünün çarpıklığını gidermek için kullanın .
  4. Görüntüyü yeniden PDF'ye dönüştürün.

Bana PDF dosyalarınızın küçük bir örneğine erişim sağlarsanız, başarıyı başarmak için bir kabuk betiği ile gelebilirim.


([Netpbm] 'in burada süper kullanıcı + yığın akışı üzerinde bir etikete sahip olmadığını merak ediyorum.)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.