WinRAR çift dosyaları tespit ediyor mu?


7

Alt dizinleri olan bir dizin ve içlerinde birçok yinelenen dosya var. Her şeyi tek bir rar arşivine taşırsam, WinRAR kopya dosyaları algılar mı yoksa hepsi arşivlenir ve rar arşivinin boyutuna eklenir mi?


5
WinRar'ın böyle bir zekaya sahip olduğunu sanmıyorum, çünkü sadece dosya adları ve uzantıları farklı yönetmenlikte aynı olabilir, içerikleri de aynı / farklı olacaktır. Bu yüzden içindeki her bir baytı kontrol etmek pahalı ve zordur. Yapabileceğiniz bir test, yukarıda belirtildiği gibi ilkini gerçekleştirin ve büyüklüğü görün. 1 dosya adını değiştirin ve aynısını yapın ve tekrar boyutunu görün. Bu aynı shud.
Zenwalker

1
Herhangi bir arşiv programında olduğu gibi, tam olarak ne yapmanız gerektiğini arşivleyecektir. Yinelenenlerden kurtulmak istiyorsanız, arşiv oluşturmadan önce bunu yapın.
Ramhound

Yanıtlar:


7

WinRAR'ın 5.00 yeni sürümü, yeni RAR5 arşiv biçimini sundu ve bu özellik pek çok geliştirmeden biri:

Aynı dosyaları referans olarak kaydet

Bu seçenek etkinleştirilirse, WinRAR arşivlemeye başlamadan önce dosya içeriğini analiz eder. 64 KB'den büyük birkaç aynı dosya bulunursa, kümedeki ilk dosya normal dosya olarak kaydedilir ve izleyen tüm dosyalar bu ilk dosyaya referans olarak kaydedilir. Arşiv boyutunu küçültmeyi sağlar, ancak ortaya çıkan arşive bazı kısıtlamalar uygular. Arşiv oluşturulduktan sonra arşivdeki ilk özdeş dosyayı silmemeli veya yeniden adlandırmamalısınız, çünkü bu, takip eden dosyaları referans olarak kullanmak imkansız hale getirir. İlk dosyayı değiştirirseniz, aşağıdaki dosyalar da ayıklandıktan sonra değiştirilen içeriklere sahip olacaktır. Extraction komutu başarıyla izleyen dosyaları oluşturan ilk dosyayı içermelidir.

Bu seçeneğin yalnızca çok sayıda aynı dosyayı sıkıştırırsanız, daha sonra bir arşivi değiştirmezseniz ve ayrı ayrı dosyaları açmadan veya atlamak zorunda kalmadan bir arşivi çıkarırsanız kullanılması önerilir. Tüm aynı dosyalar sıkıştırma sözlüğüne sığacak kadar küçükse, katı arşivleme bu seçenekten daha esnek bir çözüm sağlayabilir.

Yalnızca RAR 5.0 arşivleri için desteklenir.

320.000 dosya içeren bir klasördeki hızlı testim (çok sayıda mod içeren Baldur Kapısı Üçlemesi):

RAR4 sıkıştırma yöntemi, "Mağaza" olarak ayarlanmış sıkıştırma: 26.1 GB (28.053,815,768 bayt)

RAR5 sıkıştırma yöntemi, "Mağaza" ve "Aynı dosyaları referans olarak kaydet" olarak ayarlanan sıkıştırma açık: 23.9 GB (25.722.664.097 bayt)

Bu yüzden herhangi bir sıkıştırma kullanmadan% 9'dan fazla tasarruf başardı!


7

Dosyalar gerçekten çoğaltılmışsa (veya çoğaltılmışsa), sıkıştırma yazılımı, sıkıştırma oranını büyük ölçüde artırmak için bu benzerlikten yararlanabilir. Buna Katı Sıkıştırma denir . WinRAR ve 7-Zip, onu kullanan 2 popüler arşivdir - 7-Zip, varsayılan olarak yapar. Ben bir RAR kullanıcısı değilim, bu yüzden varsayılan konfigürasyon olduğunu söyleyemem.

Linux / Unix / BSD sistemlerindeki yaygın arşivleyiciler, aynı zamanda tar, tek bir dosyayı büyük bir blok olarak sıkıştırmadan önce tüm dosyaları tek bir dosyada (en sık kullanılan ) bir araya getirerek katı sıkıştırma yaparlar .

Tüm bunlara devasa bir uyarı, tam olarak hangi dosyaların tam olarak benzer olduğunu ya da ne kadar benzer olduklarını bilmenin hiçbir yolunun olmadığıdır. Hangi çift dosyaya sahip olduğunuzu bulmak ve arşivi çıkarmak tüm bu kopyaları geri getirecektir. Normalde, veri sıkıştırma ile tam olarak ne ister ve bekler - bu, tam olarak ne konulduğunu geri almak için.

Klasörlerinizi temizlemek istiyorsanız, yinelenen algılama yazılımına ihtiyacınız vardır. Normal koleksiyonlar için, çift dosyaları ortaya çıkaran birçok yazılım var. Medya (ses, video, resimler) ile uğraşıyorsanız, kesin kopyaları aramayacak, ancak dosyalarınızı parmak izlerine ve benzer dosya gruplarını bulabilen bir yazılım isteyeceksiniz. Bu şekilde, aynı şarkının 2 kopyasına farklı etiketlerle sahipseniz veya biraz farklı şekilde sıkıştırılmışsa (örneğin, bir 128 Kb / s MP3 ve 256 Kb / s AAC) tanımlanabilirler. Veya aynı konunun birinin kırpıldığı veya düzenlendiği 2 resmi tanımlayarak. Her medya türü genellikle benzer dosyaları bulmak için özel bir yazılıma sahiptir ve burada her türün ayrıntılarıyla ilgilenmeden önce burada sorular olmuştur. Tabii ki,


Sıkıştırma ile ilgili net açıklamalar için teşekkürler! Çok fazla yedeklemeli bir dizinde 7-zip'i denedim ve zip'e kıyasla 10 faktör iyileştirme elde ettim - ancak sözlük boyutunu ve sözcük boyutunu varsayılan değerlerinden önemli ölçüde artırdıktan sonra (varsayılan parametre değerleri temelde iyileştirme vermedi).
mitchus,

3

WinRAR istediğini yapmaz. Ancak, çoğaltılmış dosyaları bir klasör veya bölüm içinde bulabilen başka araçlar da vardır. Daha önce böyle bir şey yapmam gerekiyordu ve Easy Duplicate Finder yazılımını kullandım:

Kolay Kopya Bulucu, kopya fotoğraflar, belgeler, elektronik tablolar, MP3'ler ve daha fazlasını bulmak ve çözmek için güçlü bir araçtır! Kopyaları kaldırmak, aynı zamanda indekslemeyi hızlandırmaya yardımcı olur ve yedekleme boyutunu ve süresini azaltır. Gereksiz tüm yinelenen dosyaları kaldırana kadar bilgisayarınız tam olarak optimize edilmedi. Kolay Yinelenen Bulucu yinelenenleri kaldırsın!

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.