Dışa aktarma: Satır kesmeleri olmadan pdf'den metin kopyalama


12

Vahşi doğada her metin satırının sabit kodlanmış olduğu bazı PDF'ler var, bu yüzden bir metin bloğunu kopyaladığımda her şey onunla birlikte geliyor: Satır sonları ve hatta "-" ayırıcılar.

Sorularım: InDesign'da bu davranışın gerçekleşmediği PDF'leri nasıl oluştururum.

Birisi bunun hakkında daha fazla şey biliyor mu?


2
Bunun birçok akademik makalede büyük bir sorun olduğunu ve bu soruna hiçbir neden / çözüm bulamadığımı yorumlamak istiyorum. İyi cevaplar umut!
benteh

... bu nedenle, suçlamadan önceki prembrium döneminden kalma bazı aptalca uygulamalarda bazı eski ihracat işlevleri olabilir.
benteh

Yanıtlar:


3

Çünkü PDF'ler bir dizi yazılım ve çevrimiçi uygulamadan birçok şekilde oluşturulabilir . Bunların her biri metin satırlarını farklı şekilde ele alır, böylece metni PDF'den InDesign'a kopyalamaya çalışana kadar metnin gerçekte nasıl kaplandığını asla söyleyemezsiniz.

Bununla birlikte, InDesign tarafından dışa aktarılan PDF'ler genellikle her satırın sonundaki boşlukları tutacaktır, böylece her satırdan sonra bir paragraf dönüşü eklenmesinden endişelenmenize gerek kalmaz. % 100 emin olmak için Create Tagged PDFInDesign'dan PDF dışa aktardığınızda onay kutusunu işaretleyin. Şahsen her zaman bu kutuyu işaretleyeceğim ve kullandığım herhangi bir hazır ayara ekleyeceğim. Bu seçenek hakkında daha fazla bilgiyi burada bulabilirsiniz .

Kötü dışa aktarılan bir PDF'de çalıştırırsanız ve metnin her satırından sonra arka paragraf paragraflarını temizlemeniz gerekiyorsa, en hızlı seçenek Bul / Değiştir'dir. Tür ^piçinde Find whatalan ve bir boşluk koymak Change toalanında. Durumunuza bağlı olarak Storyveya Selectionaşağıdan birini seçin; bu, metninizi temizlemelidir.

değişiklik bul iletişim kutusu


2

Çalışmanın bir yolu, PDF'yi Acrobat Pro'dan HTML olarak dışa aktarmak, bu dosyayı web tarayıcınızda açmak ve ardından metni oradan kopyalamaktır.

Metin biçimi olarak dışa aktarmanın aksine, html genellikle satırları kesmez.

Bildiğim kadarıyla bunu InDesign'dan engelleyemezsiniz, PDF veya PDF yazılımından gelen bir davranış gibi görünüyor. "Metin çerçeveleri / kutuları" kullanan tüm yayıncılık yazılımlarının PDF'de bu tür metinler oluşturması mümkündür.


-2

Çünkü pdf'ler metni bu şekilde tanır - her satır aslında bir paragraf haline gelir (dolayısıyla sonunda geri döner). Hiçbir yol yoktur, kopyaladıktan sonra Bul / Değiştir seçeneğini ve gizli karakterleri kullanarak belgelerde küresel olarak değiştirmeniz gerekir.


1
Ama bu davranışı olmayan pdf'ler var. Her şeyi sorunsuz bir şekilde kopyalayabileceğiniz PDF'ler. İhracatta bunun nasıl başarılabileceğini merak ediyorum.
KSPR
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.