Çok fazla resimli bir dizim var (100,000+). Bunların birçoğu kopya / özdeş görüntüler ancak açıkçası hepsinde farklı dosya adları var. Bu dizinde en fazla kopyaya sahip görüntüleri bulmam gerekiyor. Örneğin, file1.jpeg'de 120 kopya var, file2.jpeg'de 90 kopya var.
Her dosyanın md5'ini alacağımı ve bir tür işlem yapacağımı düşünüyordum, ancak ayrıntılara dair net değilim. Bu bir kabuk betiği ile yapılabilir mi?
Açıkçası, yinelenenleri kaldırmam gerekmiyor (henüz), hangi dosyaların en çok kopyaya sahip olduğunu bulmam gerekiyor.
Bu yardımcı olursa ben OS X'im.