PDF'deki bir görüntüyü komut satırını kullanarak değiştirme

Bazı PDF dosyalarını işlemem gerekiyor. Görev, verilen bir görüntü dosyasını diğeriyle değiştirmekten oluşur. İlk sorunum, toplu işlemde bir PDF görüntüsünü komut satırından nasıl değiştireceğim. Daha sonra, değiştirmem gereken görüntünün hangisi olduğunu belirleme gibi diğer sorunları ele almaya çalışacağım (çünkü PDF dosyalarında birden fazla görüntü olabilir). Ama önce ilk sorunu çözmek istiyorum: PDF'deki bir görüntüyü başka biriyle nasıl değiştirebilirim.

Poppler-utils ve pdftk hakkında okudum ama bildiğim kadarıyla, bu araçların hiçbiri görüntüleri PDF'ye değiştirmeye izin vermiyor.

command-line pdf images

— Ivan
kaynak

Bir cevap bulursanız bilmek gerçekten ilginç olacaktır. "Sorun sayfasını" izole ettikten sonra, bir görüntüyü başka bir görüntüye eklemek ve ardından pdf'ye dönüştürmek için kullanabilirsiniz: imagemagick.org/Usage/layers Ayrıca: superuser.com/questions/614784/…

— Konstantinos

Teşekkürler @pidosaurus Bu seçenekleri değerlendiriyordum ama büyük bir sorunu var: PDF'yi (veya imza sayfasını) görüntülere dönüştürmeyi ima ediyor. Bu bir sorun çünkü ortaya çıkan PDF'nin boyutu çok daha büyük olacak ve kullanıcı örneğin kopyalayıp yapıştıracak bir metin parçası seçemedi.

— Ivan

Arama imagemagick dönüştürmek, ve dahası, openoffice ooconv araçları (şimdi libreoffice, aslında) sağlamak - Bir keresinde PDF dönüştürücü bir PPT yazmak için birini işe ve kullanılan araçlar vardı.

— matematik

Tanıdığım PDF araçlarının hiçbiri bunu yapamaz, ancak bu işlevselliğe sahip bir PDF kitaplığı kullanarak yeni bir araç yazmak çok zor olmaz. Çözmeniz gereken bir sorun, PDF'de belirli bir görüntünün nasıl belirtileceği .

— Dirkt

Tamam ... Sanırım pdflatexburada eksik olan parça.

OP poppler-utilsve içine baktığını söyledi pdftk. Buna ekleyeyim pdfimages. Bunlar, birlikte pdflatexbir çözümün parçalarıdır.

pdfimages -f 4 -l 20 -j -png target.pdf imageroot

Yukarıdaki örnek kodda, pdfimages 4 ile 20 arasındaki sayfalara bakar target.pdfve tüm resimleri başlangıcında adlara sahip dosyalara çıkarır imageroot.

poppler-utilssağlar pdftotext. -layoutBelgeyi okunabilir tutmak için harika bir iş çıkaran seçeneği öneriyorum .

pdftotext -layout $1.pdf $1.txt

OP'nin pidosaurusimagemagick tarafından sunulan çözüme itirazı , bir görüntünün çıkarılabilir metne sahip olmamasıdır. Belirttiğim yardımcı programlarla OP artık çıkarılan tüm metinlerin yanı sıra tüm resimlere sahip olacak ve sayfa numaraları ve içerikleri seçenek tarafından korunacak . OP, metnin doğru sayfasını belirleyebilir ve bir yönerge ile biten ve değiştirilen resmi dosya adıyla ifade eden bir dosyaya yerleştirebilir . Sonra bunu ve belgenin geri kalanına eklemek için yeni bir tek sayfalı .pdf ile bitirmek . Resmin orijinal sayfasının metninde nerede kaldığını biliyorsanız , resmi tam olarak doğru yere yerleştirebilirsiniz.-layout.tex%includegraphicspdflatexpdftk%includegraphics [h]

— Richard Sonnenfeld
kaynak