Makul otomatik HTML'den PDF'e dönüştürme (UNIX / Linux ortamında) [kapalı]


16

PDF'nin giriş dosyasına makul düzeyde benzerlik sunduğu Linux'ta otomatik olarak HTML dosyalarından PDF belgeleri oluşturmanın bir yolu var mı?

Bir tür etkileşimli GUI'nin aksine bir komut satırı aracı anahtardır.

htmldocElbette denedim ve bazı ilgili kuzenler. Ancak bu araçlar umutsuzca taş devri; htmldocCSS'yi hiç desteklemiyor. Bugünlerde en azından bazı CSS stilleri olmayan çok sayıda HTML belgesi bulamayacaksınız . Aptal etkileri veya küçük süslemelerle ilgilenmiyorum, ancak sorun şu ki, CSS bu günlerde çoğu mizanpajın merkezinde yer alıyor; artık pek çok kişi 6 katman iç içe tablo kullanmıyor. Dolayısıyla, dönüştürme aracının CSS'yi hiç kavramamış olması, bu sadece "belge tam olarak doğru görünmüyor" meselesi değildir; minimum kullanılabilirlik standardını hiç karşılamaması muhtemeldir.

Bazı insanlar tarafından PDF'lere dönüştürülebilen görüntüler oluşturmak için Gecko oluşturma motorunu kullanmaya çalışmaları önerildi, ancak birinin bunu nasıl rahatlıkla yapabileceğine dair hiçbir fikrim yok.

Bunu yapan iyi ticari araçların olduğuna inanmakta hiç sorun yaşamıyorum, ancak mümkünse gerçekten açık kaynaklı bir paket arıyorum, çünkü çabanın kendisi açık kaynaklı bir paket ve ödeme yapmıyor.

Şimdiden teşekkürler!

Yanıtlar:


7

Wkhtmltopdf'i gördünüz mü ? Kişisel olarak ne kadar iyi çalıştığını söyleyemem, ancak tam olarak ihtiyacınız olan gibi görünüyor. Bu ve herhangi bir 'tarayıcı otomasyonu' çözümü ile tek sorun, ekran görüntüsü yerine baskı stil sayfasını alması olabilir, böylece PDF tam olarak ekranda gördüğünüz olmayabilir.


Baskı stil sayfası nedir? CSS evrenindeki en yeni ve en yeni şeylerle temas etmemeliyim.
Alex Balashov

Yeni bir şey değil, sadece çoğu web sitesi için tablolar yerine düzen için CSS'ye geçtikten sonra pratik hale geldi. Giriş için alistapart.com/articles/goingtoprint veya webcredible.co.uk/user-friendly-resources/css/… adresini deneyin .
robertc

2

Chyt2pdf'i python-beautifulsoup ile deneyin.


2

XHTML2PDF , hem komut satırı komut dosyalarını hem de bir Python kitaplığını içeren bir Python araç kümesidir (bunu komut dosyasına yayılmadan daha büyük bir şeye gömmek istiyorsanız.) HTML / XHTML ve CSS'yi destekler biçimlendirilmiş çıktıyı ayarlama (ör. sayfa numaraları, paragraf akışı vb.)

Birkaç HTML belgesini toplu işlemek için biraz kullandım, ancak iyi çalıştı ve özellik seti bana kapsamlı görünüyor. Kılavuz demo sayfasında gizlidir, ancak kendisi, bir HTML dokümanından PDF'ye dönüşümün iyi bir örneğidir.

"Önce" ve "sonra" örneklerine hoş bir bağlantı dizim vardı, ancak hesabımı yeni oluşturdum ve görünüşe göre yalnızca spam gönderenler ilk gönderilerine birden fazla bağlantı koydular:


1

Komut satırından HTML sayfalarından bazı PNG oluşturmak istedim. Bir yerde bir ekran görüntüsü oluşturmak için mozembed kullanan bu yakut betiği buldum . Ölçeklendirilmesini istemiyorsanız ölçek çizgisini kaldırabilirsiniz.

Gördüğüm tek sorun, sayfanın aslında bir an için ekranda görünmesi ...


Hm, evet. Son kısım biraz katil gibi görünüyor. Bunun tamamen sunucu tarafı arka ucuna dönüştürülmesi gerekir; ekran kafası falan yok. Bunu başarmanın bir yolu var mı?
Alex Balashov

0

de komut satırından iyi çalışır dompdf deneyin ve örnekleri ile her türlü html ile çalışır


0

PrinceXML. CSS işleyebilir. Linux, Windows, Mac OS X sürümleri mevcuttur. AFAICS, bu aynı zamanda Google Dokümanlar'ın PDF çıktısının arkasındaki teknolojidir. Ancak not: bu ödeme yazılımıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.