TLDR
Orijinal soru belirsizdi ve OP'nin sadece bir dosyanın içeriğinin benzersiz bir sürümünü istediğini okuyun. Aşağıda gösterilmiştir. Sorunun güncelleştirilmiş biçiminde, OP şimdi dosyanın içeriğinin benzersiz olup olmadığını bilmek istediğini belirtiyor.
Dosyanın içeriğinin benzersiz olup olmadığını test edin
sort
Bir dosyanın benzersiz olup olmadığını veya bunun gibi kopyaları içerdiğini doğrulamak için kullanabilirsiniz :
$ sort -uC input.txt && echo "unique" || echo "duplicates"
Misal
Diyelim ki bu iki dosyam var:
yinelenen örnek dosya
$ cat dup_input.txt
This is a thread 139737522087680
This is a thread 139737513694976
This is a thread 139737505302272
This is a thread 139737312270080
This is a thread 139737203164928
This is a thread 139737194772224
This is a thread 139737186379520
benzersiz örnek dosyası
$ cat uniq_input.txt
A
B
C
D
Şimdi bu dosyaları analiz ettiğimizde benzersiz olduklarını veya kopyalarını içerdiğini söyleyebiliriz:
yinelenen dosyayı test et
$ sort -uC dup_input.txt && echo "unique" || echo "duplicates"
duplicates
benzersiz dosyayı test et
$ sort -uC uniq_input.txt && echo "unique" || echo "duplicates"
unique
Orijinal soru (dosyanın benzersiz içeriği)
Sadece aşağıdakilerle yapılabilir sort
:
$ sort -u input.txt
This is a thread 139737186379520
This is a thread 139737194772224
This is a thread 139737203164928
This is a thread 139737312270080
This is a thread 139737505302272
This is a thread 139737513694976
This is a thread 139737522087680