Все мы люди и все мы человеки. Со временем наша лень побеждает нас, и некогда красиво организованные файловые ресурсы превращаются в совершенно некрасивые файловые помойки. В том числе и за счет дублирующихся файлов.
С одной стороны, есть в убунтах, а также прочих никсах утилита fdupes, которая ищет дубликаты файлов в заданном пути. С другой, вывод этой утилиты далёк от совершенства и результат не очень пригоден для дальнейшей автоматизированной обработки. Пришлось написать скрипт-обёртку, который берет вывод fdupes и выводит результаты во что-то похожее на csv.
На выходе получаем CSV (разделитель полей - точка с запятой) в UTF8. Excel в этом плане туп и открывает его в 1251. Решение: в новой книге сделать импорт данных "из текста", задав нужные параметры.
Open/Libre-office сразу предлагают окно настроек и открывают в правильной кодировке.
С одной стороны, есть в убунтах, а также прочих никсах утилита fdupes, которая ищет дубликаты файлов в заданном пути. С другой, вывод этой утилиты далёк от совершенства и результат не очень пригоден для дальнейшей автоматизированной обработки. Пришлось написать скрипт-обёртку, который берет вывод fdupes и выводит результаты во что-то похожее на csv.
На выходе получаем CSV (разделитель полей - точка с запятой) в UTF8. Excel в этом плане туп и открывает его в 1251. Решение: в новой книге сделать импорт данных "из текста", задав нужные параметры.
Open/Libre-office сразу предлагают окно настроек и открывают в правильной кодировке.