View previous topic :: View next topic |
Author |
Message |
mango123 Apprentice
Joined: 07 Dec 2004 Posts: 266 Location: msk
|
Posted: Fri Nov 17, 2006 1:28 pm Post subject: Поиск дублирующихся файлов |
|
|
Добрый день всем.
Хотелось бы разобрать файло-помойку на файл-сервере.
Если ли утилиты для поиска дублей?
Подойдёт, как консольная, так и GUI-вая программа. Или может кто скрипт поиска одинаковых файлов уже делал?
Прошу реплики типа, "удали всё" или rm /* /dev/null оставить при себе
Пожалуйста по-существу.
Заранее спасибо. |
|
Back to top |
|
|
viy Veteran
Joined: 03 Jul 2004 Posts: 1580 Location: Riga, Latvia
|
Posted: Fri Nov 17, 2006 1:30 pm Post subject: |
|
|
Что значит одинкаовые файлы? |
|
Back to top |
|
|
mango123 Apprentice
Joined: 07 Dec 2004 Posts: 266 Location: msk
|
Posted: Fri Nov 17, 2006 1:33 pm Post subject: |
|
|
viy wrote: | Что значит одинкаовые файлы? |
означает "полностью одинаковые файлы".
С одинаковым содержанием. Как ещё объяснить? |
|
Back to top |
|
|
Laitr Keiows Bodhisattva
Joined: 04 Jul 2005 Posts: 891 Location: Kobe, Japan
|
Posted: Fri Nov 17, 2006 2:02 pm Post subject: |
|
|
Нашел в гугле на первой странице...
|
|
Back to top |
|
|
viy Veteran
Joined: 03 Jul 2004 Posts: 1580 Location: Riga, Latvia
|
Posted: Fri Nov 17, 2006 2:14 pm Post subject: |
|
|
Не приходилось.
Но я бы делал так:
- рекурсивно сканировал бы все файлы во всех директориях (те, что меня интересуют, не всю систему);
- если данного файла (путь+имя) нет в базе, или время модификации изменилось, то считал бы хэш (md5, sha*, и пр.) и сохранял/изменял бы в базе путь+имя, дату модификации и хэш.
Потом бы построил индекс на хэши (и еще на пути я думаю) и искал бы дубликаты и пр. фишки.
Не знаю, может есть что-то готовое уже с таким функионалом. |
|
Back to top |
|
|
mango123 Apprentice
Joined: 07 Dec 2004 Posts: 266 Location: msk
|
Posted: Fri Nov 17, 2006 2:36 pm Post subject: |
|
|
Laitr Keiows wrote: | Нашел в гугле на первой странице...
|
Спасибо. Уже сканит |
|
Back to top |
|
|
|