Her gün birçok yeni olanlar da dahil olmak üzere birçok gz dosyası içeren bir havuzu yedeklemek için rsync kullanıyorum. Bu gz dosyaları gzip'in --rsyncable seçeneğiyle (gz dosyalarını boyutlarını önemli ölçüde artırmadan veya uyumluluklarını etkilemeden çok daha 'rsync dostu' yapar) yapılmadığından, rsync yedeklemesi olması gerekenden daha yavaş ilerler. Ve dosyaları oluşturma zamanında düzeltemiyorum çünkü dosyalar python'un gzip modülünü kullanan bir python betiği (rdiff-backup) tarafından üretiliyor ve bu gzip'in --rsyncable eşdeğerini desteklemiyor.
Bu yüzden rsync çalıştırmadan önce kaynak verilerdeki yeni gz dosyalarını belirleyebilirim (yani rsync'in son çalıştırılmasından bu yana yeni). Şimdi rsyncable-formatında gzip böylece bu dosyaları 'yeniden gzip' istiyorum. Sonra optimize edilmiş kaynaktan rsync çalıştırabilir.
Bu her dosyayı gunzip ve daha sonra gzip --rsyncable çalıştırmak anlamına gelir ama bunu veri veya meta veri kaybetme riski olmayacak bir şekilde nasıl yapacağımı çok emin değilim. Öneriler minnetle alındı.
--rsyncable
.
-a
bayrağını kullanarak süreleri koruyarak zamana dayalı sağlama toplamını atladığınızdan emin olun . Ayrıca, gzip sürümümde bir --rsyncable
bayrak yok, ancak znew
muhtemelen ihtiyacınız olan şey için kullanılabilecek bir programla birlikte geliyor .
--rsyncable
yardımcı olmayacağı ortaya çıkıyor. Güvenli bir şekilde gz arşivi açmak ve kullanarak yeniden paketlemek için bir kod veya kısa komut satırı umuyordum --rsyncable
. Ama bu sadece benim için akademik bir soru.
--rsyncable
şey, dosyaların çalıştırmalar arasında değiştirilip değiştirilmeyersync
çalışılmasıdır. Yeni dosyalar yeniden senkronize edilip edilmeyecekleri umurumda değildir, çünkürsync
tüm verileri yine de göndermelidir. Rsync çalıştırmaları arasında değiştirilen dosyalar mı var?