Kısacası:
Sıkıştırılmış olup olmadığını bilmek için:
strings your.pdf | grep /Filter
Bir PDF'yi sıkıştırmak ( açmak) için QPDF kullanın
qpdf --stream-data=compress your.pdf compressed.pdf
qpdf --stream-data=uncompress compressed.pdf uncompressed.pdf
açıklama:
Bir pdf dosyasının içindeki "Filter" anahtar sözcüğü, kullanılan sıkıştırma yönteminin bir göstergesidir. Onlardan bazıları:
CCITT G3 / G4 - tek renkli görüntüler için kullanılır
JPEG - görüntüler için kullanılan kayıplı bir algoritma
JPEG2000 - görüntüleri sıkıştırmak için de kullanılan
JPEG'e daha modern bir alternatif Flate - metinlerin yanı sıra görüntüleri sıkıştırmak için de kullanılır
JBIG2 - Tek renkli görüntüler için CCITT sıkıştırması
LZW - metinlerin yanı sıra görüntüleri sıkıştırmak için kullanılır ancak yerine Flate
RLE kullanılır - tek renkli görüntüler
için kullanılır ZIP - gri tonlamalı veya renkli görüntüler için kullanılır
( buradan kopyalanır ).
Bununla birlikte, PDF karmaşık dosya yapısı göz önüne alındığında, çoğu zaman PDF'nin bir kısmı (veya "akışı") zaten bir şekilde sıkıştırılır (ve selamlama / Filtreleme sırasında görünecektir), ancak diğer kısmı olmayacaktır. PDF'nin sıkıştırılıp sıkıştırılmadığı sorusuna EVET / HAYIR yanıtı yoktur.
Bunun üstesinden gelmenin bir yolu -c
, olay sayısını döndüren grep seçeneğini eklemek olacaktır , böylece nispeten ne kadar iyi sıkıştırıldığını görebilirsiniz. örneğin, 10'dan daha az döndürürse , sıkıştırılmamış olur.strings
"large
.pdf" | grep -c /Filter
PDF'lerde boyutla ilgili bir başka özellik, "optimize edilmiş" PDF'lerin wikipedia'dan alıntı yapmak için boyut olarak daha büyük olmasıyla hızlı erişim için optimize edilmiş olup olmadıklarıdır :
PDF dosyalarında doğrusal olmayan ("optimize edilmemiş") ve doğrusal ("optimize edilmiş") olmak üzere iki düzen vardır. Doğrusal olmayan PDF dosyaları, doğrusal sayfalarına göre daha az disk alanı tüketir, ancak belgenin sayfalarını birleştirmek için gereken verilerin bazı bölümleri PDF dosyası boyunca dağıldığından, erişimleri daha yavaştır. Doğrusal PDF dosyaları ("optimize edilmiş" veya "web optimize edilmiş" PDF dosyaları olarak da bilinir), bir dosyanın içindeki diske yazıldıklarından, dosyanın tamamını indirmesini beklemeden Web tarayıcı eklentisinde okunmalarını sağlayacak şekilde oluşturulur. doğrusal (sayfa sırasına göre) moda. PDF dosyaları Adobe Acrobat yazılımı veya QPDF kullanılarak optimize edilebilir.
PDF'yi kullanarak optimize edilmiş olup olmadığını kontrol edebilirsiniz pdfinfo your.pdf
.
file
. Dosyanın sıkıştırılıp sıkıştırılmadığını göstermelidir.