Ignacio'nun cevabı gayet iyi. Aslında, listemdeki ilk şey olurdu. Peki, bu ve belki pdftohtml
de poppler ile birlikte gelen aracı önermek için , metni paragraflara yeniden birleştirmeye çalışmak istiyorsanız pdfreflow ile birleştirin. (Tabii ki, bu size HTML çıktısı verecektir, ancak HTML'yi düz metne dönüştürmek birçok şekilde yapılabilir.)
İşte başka seçenekler de.
ebook-convert
Dan komut satırı aracı Caliber düz metne .pdfs dönüştürebilir, (veya RTF veya e-kitap formatları bir dizi vb ePub'a gibi)
pdftxtextract
dan Podofo
Abiword , girebileceği / dışa aktarabileceği herhangi bir format arasında dönüştürme yapmak için komut satırından çağrılabilir ve uygun içe aktarma eklentisi ile PDF'ler şunları içerir:
abiword --to=txt file.pdf
(Adil olmak gerekirse, AbiWord ve calibre'nin her ikisi de poppler kütüphanelerini kullanıyor, ancak olumlu değilim.)