FLAC dosyalarının büyük bir kütüphanesini tekilleştirmek için ZFS kullanmaya çalışıyorum. Bunun amacı iki yönlüdür:
- Depolama kullanımını azaltın
- Kütüphaneyi bulut depolama alanıyla senkronize etmek için gereken bant genişliğini azaltın
Bu dosyaların çoğu aynı müzik parçasına ama farklı fiziksel medyaya ait. Bu, çoğunlukla aynı oldukları ve genellikle aynı boyuta yakın oldukları anlamına gelir, bu da blok düzeyinde veri tekilleştirme işleminden yararlanmaları gerektiğini düşünmemi sağlar.
Ancak testlerimde iyi sonuçlar göremiyorum. Bir havuz oluşturup bu parçalardan üçünü eklediğimde (farklı kaynak ortamlardan aynı şarkılar) zpool listesi 1.00 tekil rapor veriyor. Tüm dosyaları kopyalarsam (üçünün tam kopyalarını yaparsanız) veri tekilleştirici tırmanıyor, bu yüzden etkin olduğunu ve çalıştığını biliyorum, ancak orijinal dosya koleksiyonunda herhangi bir çoğaltma bulamadım.
İlk düşüncem, belki değişken başlık verilerinin bazılarının (meta veri etiketleri vb.) Bu dosyalardaki (ses kareleri) veri yığınını yanlış hizaya getirdiği, ancak başlık verilerini üç dosya arasında tutarlı hale getirdiği olabilir. tekilleştirme üzerinde herhangi bir etkisi olduğu görünmüyor.
Alternatif yollar almayı düşünüyorum (diğer veri teçhizatı dosya sistemlerini ve bazı özel kodları test ediyorum) ancak ZFS kullandığımızdan ve ZFS çoğaltma seçeneklerini sevdiğimden, bu proje için ZFS veri teçhizatını kullanmayı tercih ediyorum; ama belki de bu tür verilerle iyi çalışabilecek durumda değil.
Bu tür bir veri kümesi için veri tekilleştirme performansını artırabilecek herhangi bir geri bildirim veya ZFS veri tekilleştirme işleminin bu iş için doğru araç olmadığını teyit edin.