Bir pdf dosyasından metin kopyalanamıyor


39

Ders kitabımı görüntülemek için foxit PDF okuyucu kullanıyorum. Metni pdf dosyasından bir kelime belgesine kopyalamak istiyorum ancak izin vermiyor. İyi metni seçebilirim ancak metni kopyalama seçeneği kullanılamıyor. Başka belgelerden metin kopyalayabilirim, ancak bazılarını değil. Bu korumayı pencerelerde aşmanın bir yolu var mı?


Cevabım senin için işe yaramadı, bu yüzden bir ödül aldın. Bir yere böyle bir pdf örneği gönderirseniz, ben bir göz atacağım.
harrymc

@harrymc: Özellikle, tablo 6.15 değerlerini kopyalamanız bakıyordu acousticslab.org/papers/VassilakisP2001Dissertation.pdf
Endolit

@endolith: Yeni cevabımı görün.
harrymc

Yanıtlar:


29

Pdf dosyası muhtemelen metin kopyalamaya karşı kilitlenmiştir. Aşağıda kilidini açmanın iki yolu vardır:

  1. Eğer pdf yazdırmaya karşı kilitlenmemişse, kilidi açılmış bir dosyayı oluşturmak için sanal bir pdf yazıcısına yazdırabilirsiniz. Bunu görün:
    "Sırrı Bilmeksizin Yazdırılmasına İzin Verilen Şifreyi Kaldırma ve Korumalı PDF'nin Kilidini Aç" .
  2. Yazdırma işlevi kilitlenmişse,
    şuna bakın: "PDF Unlocker ile Kısıtlamaları Kaldır ve Parola Korumalı PDF Dosyalarını Aç" .

PDF'nin kopyalama için kilitli olup olmadığını görebilirsiniz. Dosya menüsünden Özellikler'i seçin ve Güvenlik sekmesinde İçerik Kopyalamaya izin verilip verilmeyeceği yazıyor.
Rob Sedgwick

PDF'yi yazdırmaya çalıştım. Yazdırılan dosya metin seçilmesine izin vermiyor, metni resme dönüştürmüş gibi görünüyor.
queezz

@queezz: PDF, başlamak için görüntüleri içermelidir.
harrymc

@harrymc Evet, görüntüler var. Ancak metin aynı zamanda görüntülere de dönüştürülür. Google Chrome seçeneği aynı belgede iyi çalışıyor.
queezz

İlk bağlantınız, işe yaramaz olması kötü olmayan, hatta archive.org'a da arşivlememişsiniz gibi görünen primopdf.com/installers/4.0.1/FreewarePrimo64Setup.exe ile bağlantı kuruyor . İkinci bağlantınız tamam ancak bir dosya paylaşım sitesine bağlanıyor dfiles.eu/files/7kiqyvswk dosyası olsa da virustotal ile kontrol edildi. Ama bu mydigitallife sayfasında çeşitli bağlantılar olduğu için bulmak kolay değil. "PDF Unlocker, buradan linkle indirilebilecek ücretsiz bir kullanıcı dostu bir araçtır (şu anki sürüm 1.0.4)."
barlop

25
  1. PDF'yi Google Chrome'da açın (PDF dosyasını sürükleyip Chrome'a ​​bırakın).
  2. Belirli bir sayfayı PDF olarak yazdırın veya yalnızca baskı önizlemesini açın.
  3. Artık metni önizlemeden veya çıktı PDF'den kopyalayabilirsiniz. Ama masayı doğrudan kopyalayabileceğini sanmıyorum.


4
Bu benim için de işe yarıyor. Burada gördüğüm en kolay yöntem bu.
endolith

3
Kesinlikle harika. Oh, bu arada dosyaları hızlı bir şekilde açmak için Chrome'un sekme çubuğuna sürükleyebilirsiniz.
İyono

Bu yöntemlerden hiçbiri Chrome 53'te benim için işe yaramadı. Boşluk muhtemelen kapandı mı?
Simon East

11

Ghostscript (Windows için geçerlidir) kullanarak PDF dosyanızın DRM'siz bir sürümünü oluşturabildim .

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

Ortaya çıkan dosya stripped.pdfAdobe Reader'a yüklenebilir ve Reader, dilediğiniz herhangi bir bölümünü kopyalamanıza izin verecektir. Ayrıca, tablonun biçimlendirmesinin çoğunu da korur.


Bu mükemmel. Vergi muhasebecim bana DRM olmayan PDF'ler veya DRM'yi kaldırmak için kullanılan şifreyi vermeyi reddediyor. Bu benim sorunumu çözdü. Harika iş!
kevinarpe

PDF'nin bir şifresi varsa, -sPDFPasswordanahtarı ( -sPDFPassword=password) eklediğinizden emin olun .
palswim

2

Tabloyu PDF dosyanızdan Okular (Linux için; KDE'nin bir parçası) kullanarak başarıyla kopyalayabildim. Bunu yapmak için Okular’ın ayarlarına girip "DRM kısıtlamalarına uy" seçeneğinin işaretini kaldırmak zorunda kaldım.

Bunun Windows kullandığınızdan beri size gerçekten yardımcı olmadığının farkındayım, ancak kullanışlı bir Linux makineniz varsa ya da kurmaya istekliysanız bir olasılık olabilir.

Ne yazık ki, biçimlendirmesi olmayan düz bir metindi, ancak tabloyu yeniden oluşturmak çok zor olmamalı gibi görünüyordu. Kopyala ve yapıştır maceramın sonuçlarını burada görebilirsiniz .


VirtualBox bunun için var. : DI ayrıca düz metni de biçimlendirmeden kopyalayabilir, ancak bir kerede bir sütun seçerek dışa aktarması oldukça kolaydır.
endolith

Okular, dikdörtgen metin seçimi yapmanızı ve sırayla tek bir sütunu çıkarmanızı sağladığından, sayı tabloları için en iyisi gibi görünüyor.
endolith

Tek sütunlar için, muhtemelen öyle. Bütün tablo için diğer cevabımı gör .
Michael Hampton,

Okular geldiğini hatırlatırız olabilir Windows üzerinde çalışır. Aslında birçok KDE yazılımı pencerelerde çalışabilir .
Bakuriu

1

GT Text'i kullanabilirsiniz, görüntüleri (ayrıca pdf snapshots = image) metne çeviren bir programdır. Alanı seçebilirsiniz ve panoya kopyalar Ücretsizdir

Resmi ana sayfa http://gttext.googlecode.com


1

kopya grileşmişse, şüphe sizin için olduğu gibi, o zaman PDF 'kilitlenir', okunabilir ancak aslında ondan bir şeyin kopyalanmasını / yapıştırılmasını engelliyor.

Bu web sitesi bir PDF'nin kilidini açacak

https://smallpdf.com/unlock-pdf


0

Yalnızca kısa snippet'ler arıyorsanız, genellikle alıntı işaretlerinin içine google’a birkaç kelime yazabilir ve tam olarak başka bir biçimde taranmış veya başka bir kişi tarafından yazılmış tam teklifi bulabilirsiniz.

Diğer bir seçenek de, metni Google’da OCR’a koyacak olan Google Dokümanlar Android uygulamasında “Fotoğraftan Doküman”. Bu elbette hataya açık.

PDF kilitleme işlevselliği hiç olmamasını diliyorum. :(


0

Endolith için cevap:

PDF'niz kopyalamaya karşı korumalıdır, ancak yazdırmaya karşı korumalı değildir.

Bu nedenle, tablo 6.15'i içeren bir sayfayı kopyalamaya karşı korumalı olmayan, başka bir PDF'ye yazdırdım, seçip kopyaladım ve sonra Word'e yapıştırdım. Şaşırtıcı bir şekilde, macunun sonucu tamamen berbattı.

Şimdi bu tabloya daha fazla baktım ve çok şaşırtıcı bir sonuç buldum: Bu bir masa değil!

Aslında, sayfaya bir tablo gibi görünecek şekilde yerleştirilmiş küçük metin parçalarının bir montajı. Ancak bu gerçek bir masa değil.

Yapabileceğiniz en iyi şey, her şeyi bir tablo olarak yeniden yazmak veya çalışmanızda yalnızca bu tablo benzeri birleştirilmiş metnin ekran görüntüsünü kullanmaktır.

İşte oluşturulan bir sayfalık pdf dokümanımdan alındığı gibi, tablonun ekran görüntüsü :

görüntü


2 programla basmaya çalıştım ama elimde sadece boş bir sayfa vardı.
endolith

Foxit Reader kullanarak kendimi sayfaya yerleştirdim, sonra da mevcut sayfayı bir pdf yazıcısına yazdırdım ( Cute Pdf Writer kullandım ). Bu akşam masayı kopyalamakla ilgili problemi analiz etmeye çalışacağım,
harrymc

Ben (GhostScript kullanır) PrimoPDF ve qvPDF çalıştı
Endolit

Yukarıdaki ekime bakınız.
harrymc

... Ayrıca bir sayfalık pdf dosyasını buraya yükledim (60 saniye bekleme süresi).
harrymc

0

Diğer bir olasılık ise Evince'dir .

Windows'ta varsayılan olarak kopyalamayı destekliyor gibi görünüyor.

Linux'ta, bu yönergelerioverride_restrictions izleyerek, önceden ayarlanmamışsa ayar kontrol edilerek kopyalama yapılabilir ( → → ).dconf-editor/org/gnome/evinceoverride_restrictions


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.