In einem Verzeichnis hatte ich sehr viele Dateien in Unterverzeichnissen liegen, die zum Teil Kopien von anderen waren. Um hiervon die gravierendsten Duplikate zu finden und diese zu löschen, habe ich folgenden Befehl verwendet:
find -type f -print0 \
|xargs -0 -P $(nproc) -n 1 md5sum \
|sort |uniq -D -w32 \
|cut -c35- |xargs -d\\n stat -c%s\ %n \
|sort -n -k1 |less