Filigran bir PDF dosyasından nasıl kaldırılır?


41

Bunun basit bir görev olacağını düşünmüştüm, fakat diğer yoldan çıktı.

Filigran, her sayfada aynı (örtüşen, ancak saydam) görüntüdür. PDFCreator 0.9.8 kullanarak PDF dosyasını kendim oluşturdum (burada hiçbir telif hakkı endişesi yok).

Arkadaşımın Adobe Acrobat Pro'yu zaten denedim, ancak işe yaramadı. Çıkarmaya çalışıyor, ama yapamıyor. Üstbilgi / altbilgi, vb. Kaldırmaya çalıştım, ancak filigran kaybolmuyor.

Filigranı nasıl kaldırabilirim?


2
PDF, elektronik bir sayfa gibi bir çıktı biçimidir. Düzenleme amaçlı değildir ve çoğu durumda, sayfaları görüntülere ve filigranları dışarı aktaran fotoğraflara dışa aktarmayı istemediğiniz şeyi yapamazsınız.
mk12

Alışveriş önerileri tüm döviz bozdurma web siteleri için geçerli değildir. Bu sorunun kapanmasını önlemek için,
hangisinin

3
Görünüşe göre PDFCreator 0.9.8'i kullanıp, filigranın her sayfaya eklenmemesi için seçeneği ayarlayın. Sanırım bu soru orjinal kaynağınız olmadığı için.
Ramhound

Yanıtlar:


73

Görüntü tabanlı filigranlar için, otomatik olarak çıkarılmasını vaat eden birkaç araç vardır. Örneğin:

Bunların hepsi denemek için ücretsizdir, ancak gerçekten istenen çıktıyı üretmek için bir lisans gerektirir.

Ancak, bu belirli PDF dosyasının filigranı (OP'nin bana e-posta yoluyla gönderdiği) tüm sayfalarda tekrarlanan tek bir resim değil. Görünen o ki, PDFCreator hepsini (neredeyse piksel piksel) her birine zorla kodladı. Bu filigranın çıkarılmasını çok daha zorlaştırır (ve oldukça şişirilmiş bir PDF dosyasına yol açar).

Filigran aslında pek çok küçük resimden oluştuğundan, onları bir PDF düzenleyicisiyle (örneğin, Foxit Advanced PDF Editor ) kaldırabilir , yalnızca seçip tuşuna basarak kaldırabilirsiniz Delete. Ne yazık ki, bunu her sayfa için tekrarlamanız gerekiyor.

Daha az zaman alan bir çözüm filigranı programlı olarak çıkarmak olacaktır. İhtiyacımız var:

adımlar

  1. Pdftk indirin ve ayıklamak pdftk.exe ve libiconv2.dll için % windir% \ System32 , yoldaki bir dizin veya istediğiniz herhangi bir başka konum.

  2. Indirin ve yükleyin Notepad ++.

  3. PDF akışları genellikle DEFLATE algoritması kullanılarak sıkıştırılır . Bu, yerden tasarruf sağlar ancak PDF'nin kaynağını okunaksız hale getirir.

    Komuta

    pdftk original.pdf output uncompressed.pdf uncompress
    

    tüm akışları sıkıştırır, böylece bir metin editörü tarafından değiştirilebilirler.

  4. Filigranın yapısını ortaya çıkarmak için uncompressed.pdf dosyasını Notepad ++ ile açın .

    Bu özel durumda, her sayfa blokla başlar

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    ve bunun gibi yaklaşık 4,000 blok. Bu belirli blok /W 1 /H 1, filigranın piksellerinden yalnızca birini ( ) belirler .

    Desen değişene kadar aşağı kaydırmak, filigranın akışının 95.906 bayt uzunluğunda olduğunu gösterir (yeni satırları sayarak). Aynı akış PDF dosyasının her sayfasında tekrarlanır.

  5. Ctrl+ Tuşlarına basın Hve aşağıdakileri ayarlayın:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    Normal ifade q 9 0 0 9 2997 4118\.67 cm.{95881}, yukarıdaki bloğun ( q 9 0 0 9 2997 4118.67 cm) ilk satırına ve ardından 95,881 karaktere, örneğin filigranın akışına karşılık gelir.

    Tümünü Değiştir tıklatıldığında , PDF dosyasının tüm sayfalarından kaldırılır.

  6. Filigran şimdi kaldırıldı, ancak PDF dosyasında hatalar var (akışların uzunlukları yanlış) ve sıkıştırılmamış.

    Komuta

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    her ikisine de bakar.

  7. uncompressed.pdf artık gerekli değildir. Silebilirsiniz.

Sonuç filigran olmadan aynı PDF'dir (ve boyutunun yaklaşık yarısı).


4
Faydalı bulduğum bir başka püf noktası: Filigranla ilgili bloğu PDF'mde bulmak zordu. Öyleyse yaptığım tek şey PDF'den tek bir sayfa çıkarmak, ideal olarak sadece filigranın olduğu bir sayfa çıkarmak değil. Sadece bir sayfadan filigrana karşılık gelen bloğu bulmak daha kolay olmalı. Ardından geri dönün ve orijinal PDF için yapın.
Kenny LJ

1
Vay, bu internette ilk sırada bu yönetmek için iyi bir yol buldum. Konteyner biçiminde okumanızı tavsiye ettiğiniz yerler var mı?
ConstantineK

2
@hobs IIRC, bu cevabı yazmak için resmi PDF referansının bölümlerini okudum .
Dennis,

1
Thanks @Dennis, size zaten bir oy verdim, ama bu en iyi kanonik kaynak gibi görünüyor. Sadece bazı bul / değiştir ve birkaç ek sıkıştırma deneme ve hata çalışması ile yapılması gerekenleri elde ettim. BÜYÜK YARDIM!
ConstantineK

7
Bunun yerine , pdf dosyalarını açmak ve sıkıştırmak için pdftkde kullanabilirsiniz qpdf. Komutlar: qpdf --stream-data=uncompress original.pdf uncompressed.pdfveqpdf --stream-data=compress uncompressed.pdf nowatermark.pdf
David Schuler

6

Filigran, aslında .PDF içindeki görüntülerin bir parçası gibi görünür ve .PDF'yi görüntülemek için ne kullanıyorsanız kullanın, üzerinde oluşturulmuş ayrı bir görüntü değildir. Filigranı, .PDF'den görüntü ayıklamadan, görüntü düzenleyiciden geçirmeden ve ardından .PDF'yi el ile yeniden yapılandırmadan kaldıramayabilirsiniz.


4

Metin filigranlarında PostScript sürümünü düzenlemek çok daha kolay olabilir: Sonra

$ pdftops document.pdf

document.ps dosyasını düzenleyin ve ardından yeniden PDF'e dönüştürün

$ ps2pdf document.ps


Linux'ta buna dikkat edin pdftopsve pdf2psfarklısınız. İlk komutu kullanın, ikinciyi değil.
Camille Goudeseune

1
Filigran metninin ne olduğunu biliyorsanız, işte bir liner. pdftops in.pdf - | sed 's/WATERMARK//' | ps2pdf - out.pdf
Camille Goudeseune

1

Damganın eserleri Adobe Acrobat Pro içinden silebilmenizdir, ancak akış nesnesi kalıcı kaldığından, fare hareketinde yenilenir.

Zor olan pdf kaynağını düzenlemeyi denerseniz, dosyanın zarar görmesi ihtimali vardır.

Damga bir akış ise, bilgisayarı yaptığım Net bağlantısını keserek kesebiliriz.

Sonra Adobe Acrobat Pro'yu kullanarak ek notlarımdan birini seçtim, açılır pencereyi açmak için sağ tıklayın ve "Yorumlar Listesini Göster" i seçtim.

Listeden nefis filigranı / damgayı seçin, açılır pencereyi görmek için sağ tıklayın ve "Sil" i seçin. Yapıştırmanın gerçekleştiği her sayfada bunu yapın.

Dosyayı başka bir adla kaydedin. Uygulamam çöktü, ancak dosyayı kaydetmeden önce!

Yeni ve daha küçük dosyayı açın; Tüm filigranların / pulların gonzo olduğuna dikkat edin.

Benim durumumda, 3 sayfalık belgemin dosya boyutu 300 kb'den etkileyici 60 kb'ye düştü. Tüm orijinal veriler ve açıklamalar bozulmadan kalmıştır - filigranları siler.

~ İyi avlanma: o)


1

zamzar kullanarak belgeyi .rtf dosyasına dönüştürün. Su işareti dönüşümden sonra otomatik olarak kaybolur. Lütfen Dikkat: - Doküman metin materyali içeriyorsa mükemmel çalışır. Her zaman çok yardımcı oldu .. (Mac kullanıcısı)


Bu denedim PDF için çalışmıyor.
Kenny LJ,

1

Bunu yapmak için başka bir yol bulundu:

  1. Kullanım pdf2htmlEX aracı (ya da HTML dönüştürücüye başka PDF) bir HTML dosyası PDF dönüştürmek için.
  2. Bir metin düzenleyiciyle HTML'yi düzenleyin ve filigranı kaldırın. Onu kurtar.
  3. HTML'ye yeni bir PDF belgesine yazdır
  4. kâr

Teşekkür ederim. Adobe Acrobat ile filigranı bu şekilde kaldıramadığınızdan emin misiniz? (Bu gerçekten daha ucuz bir çözüm olabilir.)
Apache

Adobe okuyucusundaki filigranı kaldırmak için bir tür parolaya ihtiyacınız olduğuna inanıyorum, bu yüzden bu yöntemi kullandım.
Dominik Antal

0

Bu, @Dennis'in 18:06 30 Temmuz 2012 tarihli cevabının bir ekidir. Kesinlikle zor olan davayı ele almaktadır.

Filigranın sade olduğu en basit durumda, örneğin süslenmemiş metin

Komisyon Üyesi için Smedley

sıkıştırılmamış PDF filigranları şöyle tanımlanabilir:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

Bu özel filigran örneği için 75.96yatay sapma ve 625dikey sapma nerede . (Evet, hem gerçek sayılar hem de tamsayılar görülebilir.)

Aşağıdaki gibi bir regexp, bu tür tüm filigranlar için işe yarar ve yerleşimlerindeki değişiklikleri göz ardı eder:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Farklı modifiye PDF operatörlerinin, daha karmaşık formatlara sahip filigranlarla oynayabileceğinin farkında olun. Bu fantezi, okuyucunun beklediği şeyi (ümit?) Bitişik, kolayca aranan bir dize olarak alfabe çorbası karışıklığına dönüştürür. Örneğin,

E 1 = Sm²2 tarafından mc²

Bunun ürünü olabilir:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. . . filigranınızın rengi gelişmişse veya çok daha kötüsü!

Tüm bunları kaydettikten sonra, PDFtk'in 4 $ 'lık bir lisans ücreti dikkate alınarak filigranlarla başa çıkmayı amaçlayan bir GUI sürümünün olduğunu da not edeceğim. Hiç de pahalı değil!

Öte yandan, web sitesinde şu anda O / S Windows 8ve ' nin tam desteğini verdiğini biliyorum OS X 10.8 Mountain Lion. Bu bağbozumu 4 yıl önce bitti. PDFtk modası geçmiş olabilir mi? Şüphelenmiyorum ama bilmiyorum.


PDFtk önerisi için teşekkür ederiz, temiz görünüyor, ancak evet, biraz fazla kokan "kokuyor". Ücretsiz sürüm 2.02'dir ve Wikipedia gerçekten 3 yıl önce yayınlandığını söylüyor: en.wikipedia.org/wiki/PDFtk
Apache

1
@Shiki - Aslında, PDF formatlarında ciddi araştırmalar yaptım ancak son 10 yıldaki detaylı PDF ilerleme değerlendirmemi hurdaya çıkardım. İşte özet: " PDF özelliklerinin geliştirilmesi ışığında 3 yıllık bir PDFtk sürümünün eksiklikleri ." Diyelim ki, 2005’ten bu yana birçok güncelleme yapılmış olsa da, _pDFtk_ ile her ihtimalde olabilir . Kontrol ettiğim tüm PDF belgeleri 2010 öncesi PDF standartlarına göre oluşturuldu ( aslında daha önce de .) Herhangi bir şüpheniz varsa, söz konusu PDF dosyasının ilk birkaç düzine baytını kontrol edin.
Der Schley

0

İşte bunu yapmanın ücretsiz ve ücretli yolları , Google Drive'ı kullanmanızı öneririm.

Google Drive, dosyaları açma ve bazı küçük düzenlemeler yapma yeteneğine sahiptir. Ayrıca, filigranı PDF'den çevrimiçi olarak kaldırmak için de kullanılabilir.

  1. Temel olarak Gmail hesabınızla aynı olan Google Drive hesabınızı açın.
  2. “Yeni”> “Dosya yükleme” ye tıklayın, bir PDF belgesi seçin ve ardından yükleyin.
  3. Bir kez yapıldıktan sonra, yüklenen dosyayı Drive'ınıza kontrol edebilir, ardından “Google Dokümanlar” ile açmak için sağ tıklayın.
  4. Daha sonra filigranınız otomatik olarak kaldırılacaktır. Kaydetmek için “Dosya” ya gidin ve “Farklı İndir” i tıklayın ve ardından “PDF belgesi” ni seçin.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.