PDF'leri sıkıştırırken maksimum sıkıştırma elde etmek için 7zip dosyaları oluştururken hangi ayarlar kullanılır?


15

Maksimum sıkıştırma elde etmek için 7zip dosyaları oluştururken hangi ayarlar kullanılır? Taranan resimler içeren PDF belgelerini sıkıştırıyorum. Ben LZMA2 kullanmayı düşünüyorum, ama sözlük boyutu, kelime boyutu, vb ayarlamak için ne bilmiyorum. Ayrıca, LZMA veya PPMd daha iyi seçenekler olurdu?

Ben net üzerinden bazı dosyaları (~ 200MiB) aktarılmış olması gerekir ve burada yükleme hızları çok yavaş, bu yüzden verileri mümkün olduğunca sıkıştırmak istiyorum. Tüketilen CPU zamanı çok önemli değil.

DÜZENLE

İşte çeşitli sıkıştırma yöntemlerini test ettikten sonra aldım:

Sıkıştırılmamış boyut: 25,462,686B

İşlemcim Intel Core 2 Due T8100 ve 4GiB ram var.

En iyi sıkıştırma, PAQ8O algoritması kullanılarak PeaZip ile yapıldı. Sonuçta ortaya çıkan dosya boyutu 19.994.325B'dir. Kullanılan ayarlar sıkıştırma seviyesiydi: maksimum. Ne yazık ki, sıkıştırma hızı 5KiB / s civarındaydı, bu nedenle verileri sıkıştırmak bir saatten fazla sürdü.

Sonraki deneysel PAQ9O kompresörü oldu. Bunu kullanarak, yaklaşık 3 dakikalık sıkıştırmada 20.132.660B aldım. Ne yazık ki, program yalnızca komut satırıdır ve diğer birçok program bu sıkıştırma algoritmasını kullanmaz. Ayrıca kullandığım ayarlarla yaklaşık 1.5GiB RAM kullanıyor (a -9 -c)

Daha sonra LZMA2 kullanan 7-Zip 9.15 beta (2010-06-20) oldu. Bunu kullanarak, yaklaşık 3 dakikada 20.518.802B aldım. Kullanılan ayarlar kelime boyutu 273, sözlük boyutu 64MB ve sıkıştırma için 2 iş parçacığı kullandım.

Şimdi orijinal soruma geri dönelim: Benim durumumda katı blok boyutu fark edilir bir sonuç vermedi. Kelime boyutunu artırmak bazı sonuçlar doğurdu. En yüksek kelime boyutu ile en küçük kelime arasındaki fark 115.260B idi. Bu tür tasarrufların, iki gerekli tıklamayı yapmak ve kelime boyutunu değiştirmek için gereken çabaları haklı çıkardığına inanıyorum.

7zip ve PeaZip tarafından desteklenen diğer sıkıştırma algoritmalarını kullanmayı denedim ve 19.8MiB'den 21.5MiB'ye kadar boyutlarda dosyalar üretiyorlar.

Sonuç olarak, çoğunlukla görüntü içeren PDF belgelerini sıkıştırırken, egzotik sıkıştırma algoritmalarını kullanmak için gereken çaba haklı değil. 7zip'te LZMA2 kullanılarak yapılan sıkıştırma en az sürede oldukça kabul edilebilir sonuçlar verdi.


PeaZip kullanımıyla ilgili farklı olan nedir? Bu sadece 7zip ve diğer birçok araç etrafında bir GUI sarmalayıcısı
Cole Johnson

@Cole "Cole9" Johnson Peki fark şu ki benim durumumda o zaman GUI olmayan PeaZip'in bazı "diğer" araçlarını kullandım. Doğru hatırlıyorsam sadece PeaZip bir GUI ile PAQ8O algoritması sundu.
AndrejaKo

Yanıtlar:


7

PDF'lerin içeriği (metin ve resimler) muhtemelen zaten sıkıştırılmıştır - bu yüzden tekrar sıkıştırmaya çalışarak kazanacak çok şey olmayacaktır.


3
Hayır. Biraz test yaptım ve 24MiB PDF aldım ve varsayılan ayarları kullanarak sıkıştırdım. Sonuç 19 MiB dosyasıydı. Benim durumumda, bu 5 MiB benim durumumda önemli.
AndrejaKo

1
Haklı görünüyorsun. Ne yaparsam yapayım 7zip varsayılanlardan önemli ölçüde daha iyi sonuçlar üretemedim. Hala bazı sıkıştırmanın hiç olmadığından daha iyi olduğuna ikna oldum.
AndrejaKo

3
Bu kadar yer kazanabildiyseniz, muhtemelen o alanın neredeyse tamamını 7-Zip olmadan kaydetmek için PDF'lerin kendileriyle yapılabilecek işler var. Acrobat'ın PDF Doktoru'nu gezmek harikalar yaratabilir.
afrazier

Usr'ın cevabına bakın - PDF (zlib) 'de kullanılan sıkıştırma, daha fazla sıkıştırmak için geri döndürülebilir (ve yeniden yapılanma üzerine tekrar uygulanabilir). Bu genellikle ~% 50 boyut küçültme ile sonuçlanır
schnaader

@schnaader: Bu gerçekten ilginç. PDF'leri görüntülenebilir tutarken değiştirmek için Acrobat'ın PDF Doktoru ve MuPDF gibi araçları gördüm ve kullandım, ancak bunları böyle kayıpsız bir şekilde dönüştürebilmek de çok değerli ve büyük avantaj için kullanılabilir.
afrazier

8

Önceden sıkıştırmayı deneyin - önce PDF'lerinizde zaten sıkıştırılmış verileri açar . Sonra 7z büyüsünü sıkıştırılmamış veriler üzerinde yapabilir.

Ayrıca çok etkili, ancak çok etkili olduğunu doğruladığım nanozip'i deneyin (PAQ algoritmalarının sıkıştırma oranlarında 400kb / s).


2

7za a -t7z -mx-9 -mfb = 258 -mpass = 15 dosyaadı. 7z alt dizini

Komut satırı yürütülebilir adınız için ilk sözcüğü gerektiği gibi ayarlayın ve dosya adınızı ve neleri içermesi gerektiğini özelleştirmek için "-mpass = 15" den sonraki parçaları ayarlayın.

Bu cevap PDF belgelerine özgü değildir.
Bu PPM yerine LZMA kullanır. PPM'den uzak durdum çünkü diğer varyasyonlarla uyumlu olmayan çok fazla varyasyon var. LZMA daha istikrarlı görünmektedir, uyumluluk daha yaygın olarak desteklenmektedir. Bu yüzden PPM'den tam olarak uzak durdum çünkü düşüncem, belirttiğiniz gibi, "egzotik sıkıştırma algoritmaları kullanmak için gereken çaba haklı değil" idi.


2
LZMA2, LZMA'dan önemli ölçüde daha iyidir, ancak sadece 64 bit sistemlerde (etkili) kullanım içindir.
OMY

-3

lzma sıkıştırması en iyisidir çünkü yüksek sıkıştırma oranına sahip bir sfx dosyası veya msi paketi yapabilirsiniz. sizin durumunuzda büyük bir dosyayı sıkıştırmıyorsunuz, bu nedenle özellikle dosya sıkıştırılmışsa fark oldukça küçüktür: mp3 veya png

kazanmak ark deneyin ücretsizdir ve bir gret sıkıştırma oranı verir

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.