Не так давно мне подвернулась
работа по сведению к одной раздаче серии публикаций одного журнала. Одна из ранних раздач, которую я использовал для работы, была в виде набора цветных сканов в PDF'овском файле. Правда сканы там были с довольно большим рингингом что немного огорчало. Ну-да это не беда.
Мне пришла в голову мысль перевести их в DjVu с OCR слоем. Но при этом убрав "паразитный" жёлтый фон ("печать была выполнена на довольно плохой бумаге газетного типа + время :-)") не затронув сам текст, сделать чётче буквы, убрать рингинг, деспеклировать и в конечном счёте уменьшить размер скана не затронув его качество. И естественно — автоматизировать этот процесс.
То что я здесь напишу, можно рассматривать и в виде урока, хоть для меня это, скорее, общий контур. Кое какие пункты можно сделать по другому, а какие и вообще, не применять в работе. Итак.
1. Переводим PDF в набор сканов:
Можно это сделать несколькими программами но я выбрал PDF-XChange Viewer (Спасибо mondey2000 за статью

). Если угодно, можно полученные файлы переименовать "групповым переименовыванием" в Тотеле.
2. Берём любой файл из полученных и копируем его в какое-то другое место на винте. Над ним мы сначала и будем издеваться.
3. Запускаем Adobe Photosop. У меня 12-я версия (т. е. "CS5 Extendet"). Открываем в нём наш файл, над которым мы будем издеваться.
4. Можете сразу не создавать экшэн а немного "помучить" картинку, я-же напишу сразу пример создания самого действия ("экшэна").
5. Итак, открываем наш скан.
Увеличиваем, для удобства, навигатором нашу картинку (Вкладка Navigator).
6. Пишем "Действие". Жмём на вкладку Action. Если её нет то (Alt+F9) или во вкладке Windows. Жмём на кнопку, внизу, Create New Action, загнутый листочек, левее от значка "мусорка".
7. Выскакивает окно New Action.
Жмём кнопку Record (запись). Началась запись действия.
8. Для удобства я перехожу во вкладку Layers (Слои).
9. Создаём новый слой, жмём на кнопку в самом низу Create New Layers (Создать новый слой), он в виде загнутого листочка. В итоге у нас получилось вот что
10. Берём, слева, пипетку (Eyedropper Tool) и делаем забор цвета,
Потом берём "ведро" (Paint Bucket Tool) и заливаем наш новый слой, тем цветом что мы выбрали пипеткой.
11. Меняем режим наложения с Normal на Divide,
больше ничего не трогаем.
12. Сливаем оба слоя в один. Клацаем правой клавишей в верхнем слое и выбираем Flatten Image.
13. Выравниваем наш скан по свету. В шапке Image —> Ajustments —> или жмём Levels (Ctrl+L). Там передвигаем левый ползунок вправо таким образом
и жмём ОК
14. "Паразитный шум" по периферии скана можно убрать таким образом: Image —> Ajustments —> Replace Color (Замена цвета).
15. Пипеткой жмём на жёлтом цвете и выставляем значение Lightness в самый край, +100, (т. е. белый). Ползунком Fuzziness задаём область применения, я оставил где-то значение 63, см. выше. Жмём ОК
16. Можете повторить эту операцию с заменой цвета и для других оттенков. Хотя, не забывайте, в СканТейлоре поля обрезаются, так что особо не усердствуйте.
— Далее идёт операция по убиранию шума и улучшению качества букв, их чёткости. Если у вас с этим всё нормально то нижнее два пункта можно проигнорировать и не писать в экшен. —
17. Я ранее говорил, что скан был неважного качества, с jpeg'овским шумом вокруг букв. Из этой ситуации я вышел таким образом. Уменьшил разрешение с помощью Image —> Image Size или (Alt+Ctrl+I) Процент, вместо 100 поставил 50 и нажал ОК
18. С помощью плагина Blow Up от Alien Skin, увеличил размер вдвое.
Жмём ОК
Для этих целей можно применить и другие похожие продвинутые плагины, например Genuine Fractals, т. е. те кто работают с фрактальным преобразованием, можно применить и плагины со сплайновыми "заморочками". Эксперементируйте!
19. Жмём Filter —> Sharpen —> Unsharp Mask (Примерные значения 105 и 18). ОК.
20. Закрываем наш файл, жмём на крестике справа. —> Yes. —> ОК
21. Переходим во вкладку Action и жмём на кнопке "Остановить" в виде квадратика.
22. Запускаем наш экшэн.
23. File —> Automate —> Batch. Кнопками Choose выбираем начальную папку, где мы складировали из PDF'ки наши сканы и конечную папку, где будут наши обработанные сканы находиться. Жмём ОК.
24. Всё!
P.S. Некоторые процессы можно и опустить, например с разрешением скана, некоторые дополнить, например применив для умного размытия фильтр Smart Blur из шапки Filter, что-бы убрать фактуру бумаги. Или ещё какой шумодав. Или поменять процессы местами, применив Levels до заливки и сведения слоёв, например.
А если ещё больше "пострадать" то сканы с фото надо обрабатывать отдельно.
Именно так я и поступал в случае с многострадальным журналом.
Удачи в эксперементировании!