HTML kitabından pdf oluşturma


16

HTML sayfası olarak kitap sağlayan bazı siteler vardır (ör. Yasal bilgiler).

Zaten var olan yapıya dayanarak bu sayfalardan PDF kitabı oluşturmak için ne kullanabilirim?

Windows'da Adobe Professional (ticari yazılım) vardır. Sanırım Linux'un bir şeyleri ücretsiz mi? Senaryo yazımı içeren bir çözüm benim için uygun olacaktır.

Yanıtlar:


9

Caliber, işleri çeşitli formatlarda e-kitaplara dönüştürmek için oldukça güçlü bir araçtır. Yakınınızdaki bir Yazılım Merkezi'nde mevcut!

Güzel UI'den daha azıyla aldanmayın, çok şey yapabilir.


1
calibre ayrıca bir ebook-convert komut satırı aracı ile birlikte gelir. Böylece bunu yapabilir for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; doneve klasördeki tüm html dosyalarını PDF'ye dönüştürür.
Şahane

1
Bu iyi bir araç, aynı zamanda bir Caliber kullanıcısıyım, en sonuncunun kullanıcı arayüzünde belirgin gelişmeler olduğunu düşünüyorum.
Sabacon

4

En kolay yol? Dosya> Tarayıcınızdan yazdırın. Seç Dosya yazdır yazıcınızdan olarak ve istediğiniz yere sizi soracaktır. PDF'yi işaretlediğinizden emin olun. "Yazdır" düğmesine bastığınızda, yazdırma işlemi yerine sürücünüze kaydedilir.


Teşekkürler. Yine de birçok dosya var. Bu manevra neredeyse imkansız.
Lucian Sasu

4

Htmldoc yararlı olabilir, buraya bakın; http://www.htmldoc.org/ yazılım merkezinden temin edilebilir, ne yazık ki 1.8 sürümü unicode şifreli dosyalar ile ilgili bir sorun var, ancak birçok durumda hala bir kurtarıcı olabilir, sorun 1.9 geliştirme sürümünde düzeltildi.

Genellikle harika karalama defteri uzantısını kullanıyorum; Firefox için http://amb.vis.ne.jp/mozilla/scrapbook/ web sayfalarını yakalamak, gerektiğinde bunları düzeltmek için not defterinde düzenleme araçlarını kullanın ve ardından tüm sayfaları PDF'ye dönüştürmek için htmldoc kullanın.



3

PDF oluşturmak için OpenOffice / LibreOffice kullanmanızı tavsiye ederim. Test olarak Wget manulunu indirdim (hepsi bir sayfada) ve daha sonra HTML sayfasını OponOffice'de açtım ve "Doğrudan PDF'ye Dışa Aktar" düğmesini tıkladım. İçindekiler tablosundan bir dizin ile PDF'yi yarattı.

Geçmişte bunu HTML sayfalarını PDF'ye dönüştürmenin en kolay yolu olarak buldum. Ayrıca fazla çaba sarf etmeden değişiklik yapmanıza izin verir.

Ekran görüntüleri:

  • Wget kılavuzu Open Office kullanılarak PDF'ye dışa aktarıldı Wget kılavuzu Open Office kullanılarak PDF'ye dışa aktarıldı

  • Open Office'te Doğrudan PDF'ye Dışa Aktar seçeneği Open Office'te Doğrudan PDF'ye Dışa Aktar seçeneği


kitap bir sayfada değil, birden fazla bölüm / bölüm altında bölünmüşse herhangi bir fikir?
Ciprian Tomoiagă

2

Calibre çözümü için oy kullandım. Ama burada deneyebileceğiniz başka bir şey var. AbiWord'u yükleyin . Komut satırından bildiği herhangi bir format arasında dönüşüm yapabilir. Bir klasördeki tüm .html dosyalarını .pdf dosyasına dönüştürmek için şunları yapabilirsiniz:

for file in *.html ; do abiword --to=pdf "$file" ; done

Daha üst düzey tipografi için (ancak tartışmasız daha karmaşık) başka bir seçenek de PrinceXML olacaktır .


2

Yazdırılacak html belgesine bağlı olarak, pandoc kullanarak en iyi sonuçları alabilirsiniz . Bu, çok yönlü HTML-LaTeX dönüştürücülerinden biridir. Ortaya çıkan .tex dosyası veya kullanılarak PDF'ye kolayca dönüştürülebilir . LaTeX sözdizimi ve paketlerini incelemek istiyorsanız birçok seçenek mevcuttur. Gömülü resimler ve süslü HTML stillerinin korunması gerekiyorsa bu işe yaramayabilir.xelatexpdflatex


1

Google-chrome'da, bir uzantı kullanarak tüm site için bir pdf dosyası oluşturabilirsiniz. Kişisel olarak sadece bir tıklamayla PDF yapan Web2PDF Converter uzantısını kullanıyorum .

İşte bu eklentinin, google uzantıları web mağazası sitesi tarafından sağlanan bir ekran görüntüsü.

resim açıklamasını buraya girin

Ayrıca, bir sonraki dosyayı (sağ klişe, hedefi farklı kaydet) indirerek bu araçla oluşturduğum bir PDF görebilirsiniz: http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (google- chrome bunu çevrimiçi görmenize izin verebilir).

Ayrıca, her sayfanın altındaki uzantı tarafından yerleştirilen dijital imzayı kaldırmak veya başka bir şeyi kaldırmak için uzantı tarafından oluşturulan PDF'leri düzenlemek istiyorsanız, şuna bakın: PDF'deki metin bilgileri kaldırılsın mı?

İyi şanslar!

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.