«deduplication» etiketlenmiş sorular

Veri tekilleştirme, yinelenen dosyaların bulunması ve kaldırılmasıdır.



3
40 TB'lık veri nasıl tekilleştirilir?
Üç dosya sisteminde ~ 40 TB veri içeren bir araştırma kümesi miras aldım. Veriler neredeyse 15 yıl öncesine uzanıyor ve araştırmacılar birbirlerini farklı nedenlerle kopyalayıp daha sonra kopyalara asıldığından büyük olasılıkla iyi miktarda kopya var. Ben fdupes ve rmlint gibi de-duping araçları biliyorum. Böyle büyük bir veri kümesi üzerinde çalışacak …

6
Bilgisayarınızdan yinelenen görüntü dosyalarını kaldırmanın en iyi yöntemi nedir?
Windows bilgisayarımda, farklı alt klasörlerde ve farklı dosya adlarında çok sayıda yinelenen görüntü dosyası var. Kopyaları kaldırmak için hangi Python betiği veya ücretsiz programı önerirsiniz? ( Bu benzer soruyu okudum , ancak poster farklı dosya boyutlarına sahip görsel kopyalar hakkında soruyor. Benimki farklı dosya adlarıyla tam kopyalar.)

3
Windows için tekilleştirme de yapan bir sıkıştırma veya arşivleyici programı var mı? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Süper Kullanıcı için. 3 yıl önce kapalı . Arşivlenen dosyalar üzerinde tekilleştirme (tekilleştirme) yapabilen bir arşivleyici programı arıyorum. Arşivin paketini açtıktan sonra, yazılım sıkıştırma işlemi sırasında kaldırdığı dosyaları …


7
Dosyaları tekilleştirme yöntemleri
Sadece birkaç makinedeki dosyaları yedeklemek ve arşivlemek istiyorum. Ne yazık ki, dosyalar aynı dosyada olan ancak farklı makinelerde farklı şekilde saklanan bazı büyük dosyalara sahiptir. Örneğin, bir bilgisayardan diğerine geçici yedekleme olarak kopyalanan birkaç yüz fotoğraf olabilir. Artık ortak bir dosya deposu yapmak istediğime göre, aynı fotoğrafın birkaç kopyasını istemiyorum. …

5
Ücretsiz Duplicate mp3 bulucu [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Süper Kullanıcı için. 5 yıl önce kapalı . Bazen içeriği analiz ederek mp3 için yinelenen bir dosya bulucu kullanmıştım. Ne yazık ki ücretsiz değildi ve shareware çok sayıda …

1
ZFS sıkıştırılmış ve dosyada dedektif dosya sistemi
Bu şekilde squasheddosya sistemleri oluşturabilirim mksquashfs: mksquashfs dir-1 dir-2 ... dir-n filesystem-on-file.squash -comp xz -Xbcj x86 -Xdict-size 1048576 -b 1024k mksquashfsVerilerin sıkıştırılmasını ve tekilleştirilmesini sağlar, ancak salt okunurdur. Şimdi ZFS, hem tekilleştirme hem de sıkıştırma etkin olan birkaç test dosya sistemi oluşturmak istiyorum . Eşdeğer komutu nedir?

2
2 sürücüde benzersiz dosyalar bulun
Aynı içeriğe sahip, ancak tamamen farklı klasör yapılarında 2 birimi karşılaştırmaya çalışıyorum. (Yaklaşık 2 milyon dosya.) Hangi dosyaların SADECE 1 klasörde olduğunu görmek istiyorum, diğeri değil - büyüklük & amp; ad. Bunu denedim: find /Volumes/1/ /Volumes/2/ -not -empty -type f -printf "%D\t%s\t%f\n" | sort -t$'\t' -k2 -n | uniq -uf1 …

3
Yinelenen klasörleri “name (1)”, “name (1) (1)” vb. Yapıyla nasıl birleştirirsiniz?
Google Filestream, Google Drive ve Synology CloudSync'im arasında senkronizasyon yapıp her şey berbatlaştı ve "" (1) "veya" (2) "vb. Adında bir klasör adı izleyen yüzlerce yinelenen klasör kaldı ve devam ediyorum. "(1) (1) (1)" e kadar. Bu klasörleri birleştirebilecek bir program veya komut dosyası biliyor musunuz? Örnek üst düzey klasör …

1
Excel: Tüm hücre değerlerini bir sayfanın tamamından yeni bir sayfaya kopyalayın, tek bir benzersiz değer listesine sıralayın ve tekilleştirin
Sahip olduğum veriler (tüm metin değerleri), kağıda dağılmıştır (aralarında boşluk bulunan birden çok satır ve sütun) ve tümü formül kullanılarak hesaplanır şimdi kesin hesaplanmış değerler listesinin tam olarak ne olduğunu bildiğimden emin olmak istiyorum. işte yapmam gerekenler burada kopya sadece değerler yeni bir sayfaya tek bir liste halinde düzenlemek (sütun) …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.