PDF'yi yeniden düzenlemenin daha iyi bir yolu var mı?


24

Son zamanlarda birine göndermek için birkaç PDF yazdırmak zorunda kaldım, ancak birkaç küçük metin parçasını yeniden düzenlemek (karartmak) istedim.

Hızlı bir google araması bu amaç için herhangi bir araç bulmadı, bu yüzden imagemagick & gimp'e geri döndüm:

  • convert document.pdf document.png
  • gimp document-0.png
  • (metni karartmak için boya fırçası kullanın)
  • gimp'ten düzeltilmiş sayfa yazdır
  • kalan sayfaları xpdf'den yazdır

Bu stratejiyle ilgili sorun, dönüştürme işleminin (PDF'den PNG'ye veya başka bir biçimde) kaliteyi kaybetmesidir. PDF'yi gimp olarak düzenlemeyi denedim, ancak hemen işe yaramadı.

Bu şekilde redasyona izin veren özel bir araç var mı? (Hatta "gerçek" yorumlama bile gerekmiyor - bir softcopy göndermiyorum, bu yüzden "sahte" açıklama işe yarayacak, çünkü basılı kopya altta yatan metni ortaya çıkarmak için saldırıya uğramayacak.)

Veya PDF'leri gimp olarak düzenleyebilmenin bir numarası var mı?


1
PDF ölçeklenebilir, PNG raster grafiklerdir, bu nedenle büyük olasılıkla dönüşüm sürecinde kalite kaybı yaşanmaktadır. SVG gibi bunun yerine ölçeklenebilir bir formata dönüştürün.
Anonim

@ İsimsiz: Güzel fikir, ancak kullanılamaz. Ortaya çıkan SVG dosyası çok büyük; 30 dakika sonra izleyiciyi öldürmek zorunda kaldım ve bir GiB ya da bellek tüketimi.
bstpierre

Yanıtlar:


15

(başlangıçta Okular'ı yeniden önerdim ancak beklediğim gibi çalışmadı)

1. Belgeyi bir vektör düzenleyicide düzenleyin

Bir PDF dosyasını Inkscape'de açabildim , bir metnin üzerine bir dikdörtgen çizip çıktısını aldım . Inkscape bir vektör editörüdür, dolayısıyla rasterleştirme söz konusu değildir. Bazı fontlar yanlış görünüyordu - büyük olasılıkla bu belge Windows makinede benimkilerin üzerinde olmayan fontlarla oluşturulduğundan.

Not hala kesintileri altında alınabilir metin olarak elektronik dağıtmak kağıda redacted belgeyi yazdırıp değil gidiyoruz pikselleştirmeyi içermeyen herhangi yöntem yalnızca kabul edilebilir olduğunu.

2. Bir bitmap düzenleyicide açılırken rasterleştirme çözünürlüğünü artırın

Gimp'te sayfayı açarken "kalite kaybı" ile ilgili olarak : Gimp'te bir PDF dosyasını doğrudan açabilirsiniz. Sürecinde rasterleştirilecektir. İşlemdeki kalite kaybı miktarı, ithal ederken seçtiğiniz bir çözünürlük sorunudur - 300 dpi size çok iyi bir kalite vermelidir (varsayılan 100'dür).

convertÇözünürlüğü artırmasını söylerseniz , ImageMagick'in komutuyla da iyi sonuçlar alabilirsiniz :

convert -density 300x300 ...

1
+1 ve kabul edildi! İnkscape'i önerdiğiniz için teşekkür ederiz, makul bir iş yaptı (mükemmel değil - birkaç (benim için önemsiz) grafik nesnelerini kaybetti) - ama çok makul). Ve bahşiş convertde iyiydi: kullandığım teşvik convert -density 300x300, kalite kaybı değildi.
bstpierre


8
Genel popülasyona karşı uyarı: Burada önerilen metni (örneğin, rasterleştirmeyi engelleyenler) tutmayı içeren redaksiyon yöntemleri güvenli değildir . Metin hala karartma altından seçilebilir veya dosyanın kaynağından okunabilir. Bakınız örneğin freerepublic.com/focus/f-news/2706743/posts and hackaday.com/2008/08/01/exposing-poorly-redacted-pdfs
naught101

Orijinal soru sadece basılı kopya gönderme hakkında sorulsa da, notlayıcı olmayan yöntemlerin kabul edilebilir olduğu kabul edilmekle birlikte, bu yanıt, sonucu elektronik olarak dağıtırken güvenlik riski konusunda açıkça yeterince bilgi vermemesi nedeniyle aşağılıdır.
Jesse Glick

4
@JesseGlick: Orijinal soruda bile belirtilmeyen bir kullanım senaryosunu ele almadığım için beni "cezalandırmak" yerine, cevabı daha yeni düzenleyebilirdiniz. Bu gelecekteki ziyaretçiler için daha faydalı olacaktır.
Sergey

10

Temel olarak, yapmaya çalıştığınız şey bir PDF'yi vurgulamak / açıklamaktır, ancak marker opaklığına ve rengine karşı biraz esneklikle (bir şeyi sansürlemeniz / kaldırmanız gerekmediğini, yalnızca redaksiyon etmeniz gerekmediğini belirtti). Buradaki cevaplara bir göz attınız mı: PDF'leri nasıl vurgulayabilir veya ekleyebilirim?

En yüksek puan alan cevaplardan biri , burada belirtilmeyen ve benim seçimim silahım olacak olan Xournal'ı tavsiye ediyor . El yazısı notları yazmanıza olanak sağlayan bir araçtır, ancak bir PDF'ye açıklama eklemenize izin veren ek özelliklere sahiptir. Varsayılan olarak, ek açıklamalarınızı ayrı bir dosya olarak kaydeder, ancak ek açıklama eklenmiş PDF'yi yeni bir PDF olarak dışa aktarmanıza da izin verir. Bu, düzeni, yazı tiplerini vb. Korumalıdır.

Xournal ile "PDF Notu" nu seçersiniz, ardından yeniden düzenlemek istediğiniz parçaları maskelemek için düz siyah bir kalem ve "PDF'e Aktar" seçeneğini kullanırsınız.

İnternette Xournal'ın dışa aktarılan PDF'deki metni rasterleştirdiğini öne süren bazı hikayeler var (bunu işaret ettiğiniz için teşekkürler, MHC). Bu doğru görünmüyor: basit açıklamalar ile metin seçilebilir ve aranabilir durumda ve dosya boyutu fazla artmıyor (aşağıdaki örnekte 205 kb'den 220 kb'ye yükseldi).

Kurmak, bir terminalde çalıştırmak için: sudo apt-get install xournalya da sadece Yazılım Merkezinden seçin

Xournal arayüzü Sonuç ihraç PDF


Xournal iyidir, ancak işlem sırasında tüm metin ve vektör bilgilerinin kaybolduğu anlamına gelen yalnızca raster PDF'leri dışa aktarabileceğini bilmeniz gerekir. Bununla başa çıkabiliyorsanız, Xournal seçtiğiniz bir uygulamadır.
glutanimate

1
Geri bildiriminiz için teşekkürler, @MHC. Xournal yok değil kafeslere ayır, daha fazla bilgi için revize cevaba bakınız.
Tomas,

3
Sadece kendim için denedim ve kesinlikle haklısın. Karışıklık için özür dilerim. Xournal'ı kullanmaya başladığımdan beri bir süre olmuştu ve bir şekilde dışa aktarılan belgelerin gerçek PDF olmadığı izlenimini bırakmıştım. Bunu düzelttiğin için teşekkürler!
Glutanimate

1
Bu iyi çalışıyor, ancak bilgiyi yeniden düzenlemek için temiz bir yol bulamadım. Çizim aracını, çok karışık görünen ve istediğim profesyonellikten yoksun karalamak için kullanmak zorunda kaldım. Aksi takdirde, dışa aktarımın içeriğini rasterleştirmesini sağlayın, böylece seçilemez ve keşfedilemez.
flickerfly

Metinsel verileri görüntülerle değiştiren gerçek bir açıklama için bu cevabı ImageMajick'in convertkomutunu kullanan @ balu ile birleştirin .
kola

6

Okular'ı kullanabilirsiniz.

sudo apt-get install okular
  1. PDF'yi Okular ile açın.
  2. Tuşuna basın F6.
  3. Tuşuna basın 8.
  4. Yeniden düzenlemek istediğiniz metni vurgulayın.
  5. Metni sağ tıklayın, özellikleri seçin, "Vurgula" olarak "Tür" ü seçin, tuşuna basın Ok.
  6. Dosyayı pdf olarak yazdırın.

4
Belki de vurguyu siyah yapmaktan bahsedin.
16'da,

1
Okular, bu işlevlerin herhangi bir rengiyle (siyah) rötuş yapabilir: metin vurgulama, serbest el çizgisi ve iç dolgulu çokgen bağlantıları. Ayarı kendi özel açıklama aracınız olarak kaydedebilirsiniz. Kolayca tekrar tekrar kullanmak. Ardından dosyayı pdf'ye yazdırdığınızda, düzeltmenin geri alınamaz olmadığından emin olmak için "rasterleştirmeyi" zorlamanız gerekir. Okular Sürüm 1.1.3
shadowbq

Varsayılan olarak siyahtır, en son Okular sürümüyle çalışır. Teşekkür ederim!
TheFrack

5

Her gün birçok PDF dosyasını yeniden yazıyorum, bu yüzden en iyi şekilde nasıl yapılacağını düşünerek çok zaman harcıyorum.

Benim için en iyi yol, PDF'yi 1 sayfalık PDF dosyasına, GIMP ile düzenlemenin yanında birleştirmek için bölmektir. İmagemagick'i tüm dosyalarda kullanmıyorum (hiç kullanmıyorum), bu nedenle tüm sayfalarda metin katmanını kaybetmiyorum, ancak yalnızca yeniden düzenlendi. Tüm PDF dosyasını bir kerede yüklemeyin, çünkü belleğin tükenmesine neden olur.

PDF'yi 1 sayfalık dosyalara bölme

Bu bash işleviyle PDF dosyalarını kolayca 1 sayfalık PDF'ye bölün (~ / .bashrc dizinine yerleştirin):

function pdf_split(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
    done;
};

Artık split_pdf file.pdfpek çok PDF dosyası almak için girebilirsiniz .

Dosyaları yeniden düzenle

Ancak, şimdi tüm bu dosyaları düzenlemelisiniz. İle yapabilirsiniz gimp original-filename-*.pdf. Dosyayı değiştirmek için GIMP'de (Ana pencere-> Düzenle-> Kısayol) kısayolu yapılandırmanızı (CTRL + R kullanıyorum), filtreyi bulanıklaştırmayı (örn. CTRL + D), dosyayı kapatmayı (örn. CTRL + W) ve GIMP'den çıkmayı öneririm ( eg.CTRL + Q). GIMP'ye aynı anda birçok dosyaya yükleme yapmayı unutmayın, ancak açtıktan sonra yüklediğiniz gibi GIMP'i gimp original-filename-*.pdfbin dosya üzerinde güvenle kullanabilirsiniz.

Dosyaları birleştir

Dosyaları kolayca ile birleştirebilirsiniz: pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";

Hepsini birbirine bağlayın

Bu işlemler çok tekrarlayan ve sıkıcı, bu yüzden hepsini 1 komut dosyasında bağlarım:

function pdf_redact(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
        gimp "${Outfile[@]}";
        pdftk "${Outfile[@]}" cat output "$filename-anon.pdf";
        rm "${Outfile[@]}";

    read -p "Do you want open output file? " -n 1 -r
    echo    
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
            evince "$filename-anon.pdf";
    fi

    read -p "Do you want upload output file to Scribd.com? " -n 1 -r
    echo 
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
        scribd_up "$filename-anon.pdf";
    fi
    done;
};

Bu betiğin en yeni sürümüne her zaman şu adresten erişilebilir: http://dostep.jawne.info.pl/it/bashrc

Komut devam etmek için tüm redaksiyonlardan sonra GIMP'yi (CTRL + Q) kapatmayı unutmayın.

Bağımlılıkta, düzeltilmiş dosyaları açmam (hepsini kontrol etmeyi okumayı severim) ve diğer betiğimle Scribd'e yüklemeyi seviyorum - scribd_up , bu yüzden şimdi çok sayıda PDF dosyasını çok verimli bir şekilde yeniden düzenleyebilirim .


2

PDF'yi ücretsiz bir araç olan PDF-Xchange PDF Viewer ile açın . Siyah dikdörtgenler kullanılarak redaksiyon edilecek metni karartın. Yazdırın. Bu size kolay, kaliteli "sahte" yorumlama getirecek.


Bu bir win32 aracı gibi görünüyor. Linux limanına olan bağlantıyı kaçırırsam bana haber verin ...
bstpierre

3
Ücretsiz taşınabilir PDF-Xchange görüntüleyici şarapla çalışacaktır.
Sabacon,

Teşekkürler, bu benim için mükemmel şarap ile çalıştı. Inkscape ve gimp çözümleri yalnızca tek sayfa düzeltmeleri için gerçekten yararlıdır.
Gearoid Murphy,

2

Aradığınız hızlı düzenleme için LibreOffice Draw kullanın. Tamamladıktan sonra, LibreOffice Draw formatı olarak kaydedebilir veya tekrar PDF formatına aktarabilirsiniz ( File> Export as PDF).

görüntü tanımını buraya girin

PDF dosyalarını LibreOffice Draw'a içe aktarabilmek için önce paketi kurmanız gerekir libreoffice-pdfimport.

Ubuntu Yazılım Merkezi'nden ( libreoffice-pdfimport Libreoffice-pdfimport yükleyin ) veya bir terminal aracılığıyla kurunsudo apt-get install libreoffice-pdfimport .


2

Bu aracı da deneyebilirsiniz: https://launchpad.net/updf

İşte (ama yine de, metin seçilebilir):

görüntü tanımını buraya girin


1
uPDF, orijinal PDF'yi, metin ve svg içeriğini koruduğu için mükemmeldir. Bununla birlikte, sıkıştırma seviyelerinde bazı problemler olduğu anlaşılmaktadır. Düzenlenen PDF'ler, orijinallerinden yaklaşık 3-4x daha büyüktür. Yine de bunu gönderdiğiniz için teşekkürler. PPDF'nin farkında değildim.
Glutanimate

Evet, bazı sorunları olduğunu biliyorum, biraz zor. Umarım yeni sürümler bu sorunları
çözecektir

Daha önce de belirtildiği gibi, uPDF çok fazla hataya sahiptir (ve geri alma / tekrarlama bile yapmaz), fakat benim durumumda hala her şey yolunda gitti.
balu

2

Bir keresinde ben ve bir meslektaşım birkaç pdf düzenlemenin bir yolunu bulmak zorunda kaldım, Gimp'i kullandık. Detayları size yorumlayacağım ... pdf'i doğrudan gimp ile açıyoruz (bir terminalde)

gimp the_file.pdf

Düzenlemeyi tamamladığınızda, değişiklikleri kaydetmedik, bunun yerine pdf dosyasına yazdırdık ... Tamam gibi görünüyordu.


Sebep ne olursa olsun, gimp dosyada herhangi bir düzenleme yapmama izin vermiyor. convertÖnce imagemagick'inkiyle dönüştürmek zorunda kaldım , sonra dönüştürülen dosyayı değiştirdim. (Kabul edilen cevaba bakınız.)
bstpierre

Tamam, inkscape'in çözümü geçerlidir. Ama tekrar ediyorum Gimp doğrudan pdf dosyalarını düzenleyebilir. = D
maniat1k

Gimp çoğu PDF dosyasıyla çalışıyor gibi görünüyor, ancak dün gece kullandığım dosya düzgün çalışmıyor. Inkscape bu dosyayı düzgün şekilde kullandı.
bstpierre

2

PDF Studio bir açık kaynak değildir ve satın alma gerektiren bir yazılımdır.

Bu soruya göre, 8. sürümden itibaren manuel bir düzeltme özelliği vardır. Kullanıcılar bir metin nesnesi seçebilir ve onu yeniden düzenleyebilir. İçerik PDF'den kaldırılır ve siyah bir dikdörtgenle değiştirilir.

Sürüm 9'da 2013'ün üçüncü çeyreğinde geliyor, resimler ve şekiller için redaksiyon açıklamaları ve yazma da mevcut olacak.


4
Sss başına, tanıtmakta olduğunuz ürüne olan bağlılığınızı açıklamalısınız.
bstpierre

Her ne kadar bu bir cevaptan çok tanıtım amaçlı bir reklam olsa da, PDFstudio’nun gerçekten de harika bir yazılım olduğunu söylemeliyim. Biraz pahalı olabilir ama kesinlikle Linux için en iyi PDF düzenleme paketi. En azından deneme sürümlerini denediğinizden emin olun .
glutanimate

2

Buradaki birçok çözüm, ek açıklamalarla yeniden düzenleme / karartmayı önerir (orijinal içeriği pdf'te bırakır), orijinal içeriği gerçekten kaldırmak için pdf'yi daha sonra rasterleştirmenizi öneririm. ( Bu adam olma .)

Bunu yapmanın bir yolu, aynı zamanda, kaliteyi ve dosya boyutunu düşük tutar (en azından benim bir sürü siyah / beyaz sayfa için):

$  convert -quality 100 -density 180 -compress zip notreallyredacted.pdf trulyredacted.pdf

Not: convertImageMagick'i gerektirir.

Not 2: convertdoldurmuş olabileceğiniz formların içeriğini korumaz. Kaybolmaması için, belgeyi "bir dosyaya" evinceilk önce (veya formu hangi uygulamada doldurduysanız) veya daha sonra rasterleştirin.


Yeni izinler düzeltmesini ekledim. Bu cevap Xournal ile birleştirilmelidir.
kola

1

Bunu yapmanın en iyi yolu, http://www.pdfescape.com adresini kullanmaktır . Ek açıklama ekleyebilir, metin ve resim ekleyebilir, yeniden düzenlemek istediğiniz öğelerin etrafına "beyaz çıktı" dikdörtgen çizebilir ve hızlı bir şekilde indirip kaydedebilirsiniz. Ayrıca çok sayfalı belgelerle de gerçekten iyi çalışır, bu da birçok başka çözümün işe yaramadığı bir şeydir. Örneğin, Gimp veya Inkscape'de çok sayfalı bir belge açarsanız, bir seferde yalnızca bir sayfa açabilirsiniz. PDFescape'de işlem çok daha hızlı. İki sayfalık bir dokümanı yeniden yazmamın tüm süreci bir dakikadan az sürüyor.


1
Üzerine çizdiğiniz verileri gerçekten silmez. (Hala onu arayabilirim ve aşağıda "vurgulayacaktır".)
Frank Nocke

1

Eğer doğru sihir hatırlamak istemiyorsanız convertkullanabileceğiniz pdf-yazıya dökmek-araçlar , (seçtiğiniz örneğin Gimp'teki bir araç kullanarak PNG formatına dönüştürür PDF patlayan ve redaksiyon sonra bir araya onları geri birleştirme süreci otomatik hale bir kabuk ). Conventiently uygun-kurulabilir olsun .


0

PDF belgelerini doğrudan düzenlemek gibi birden çok düzenleyici vardır pdfeditveya bunları daha iyi desteklenebilecek diğer vektör biçimlerine dönüştürün pstoedit. Bununla birlikte, hiçbirinin aptalca bir şey yapma riski olduğu için kullanılmasını tavsiye etmem, vektörleri yerinde bırakırken sadece metinle siyah üzerine boyamak gibi, kolaylık sağlar, böylece redasyonu geri almayı önemsiz kılar.

Vektörün bitmap yoluna gitmesi, alfa kanalları veya metni okunabilir bırakabilecek renk farklılıklarıyla ilgili olası sorunlardan kaçınmak için en güvenli yoldur, tercihen 1 bit bitmap yoludur.

Mümkünse her zaman orijinal belgeyi yeniden düzenlemelisiniz ve düzeltilmiş metnin etrafındaki metnin karakter aralığı ve aralığı bile verebildiğinden, PDF'deki boyayı değil, bilgileri çıkarın.


Düzgün bir şekilde yeniden düzelterek sorunları anlıyorum, ancak sonradan gelen herkes için onları göstermeye özen gösterdiğiniz için teşekkür ederiz. Benim durumumda, PDF'nin kendisi atılabilir - aradığım tek şey bir basılı kopya. (Basılı kopyalarım olur olmaz PDF silinir.) FWIW, pdfeditişe yaramadı: söz konusu metnin üstüne siyah bir dikdörtgen çizdiğimde, sayfanın geri kalanını nükleer bir belge ile bırakarak Tekli siyah dikdörtgen.
bstpierre

0

Listeye ekledim : Krita . Kalite kaybı olmadı, çünkü PDF'yi içe aktarırken dpi'yi tanımlayabilirsiniz (@Sergey’in dediği gibi 300 olarak ayarlayın). Düzenlemeden sonra "PDF olarak ver" e tıklayın. Son olarak, Photoshop'u uzun süredir kullandıktan sonra, Krita'yı Gimp'den daha sezgisel buluyorum.


-1

PDF dosyası oluşturmak için LibreOffice kullanıyorsanız, dokümanı LibreOffice'de açın, düzenlenecek metni vurgulayın, sağ tıklayın ve karakter seçin, Arkaplan'ı seçin ve siyah üzerine tıklayın. PDF'ye aktar.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.