Создание электронных книг из сканов: как получить DjVu или PDF из бумажной книги?

Страницы :   Пред.  1, 2, 3, 4, 5, 6, 7, 8, 9  След.
Ответить
 

aawaaw

Стаж: 15 лет 11 месяцев

Сообщений: 575


aawaaw · 24-Фев-25 15:36 (4 месяца 3 дня назад)

я бы сканкромсатор попробовал. вроде он не ошибается.
[Профиль]  [ЛС] 

mcach

Top Bonus 01* 300GB

Стаж: 15 лет 7 месяцев

Сообщений: 1261

mcach · 24-Фев-25 20:44 (спустя 5 часов)

psikov писал(а):
87442548Посоветуйте, плиз, какую-нить программу для автоматического выравнивания текста. Чтоб на входе в нее загружать изображения или сканы с перекошенным текстом, а в результате она бы делала те же изображения повёрнутыми ровно на тот угол, при котором строки текста параллельны и перпендикулярны.
Какой редактор лучше всего использовать для этого?
Самое простое - Scan Tailor.
[Профиль]  [ЛС] 

psikov

Стаж: 14 лет 11 месяцев

Сообщений: 77


psikov · 25-Фев-25 11:41 (спустя 14 часов)

mcach писал(а):
Самое простое - Scan Tailor.
В Scan Tailor какой надо ставить DPI вывода? В два раза больше, чем исходный?
Я когда-то смотрел туториал от автора Скантейлора, так там он говорит, что разрешение вывода лучше всего увеличивать в два раза.
Если, к примеру, на входе были картинки с разрешением 400х400, то разрешение вывода в Скантейлоре надо ставить 800х800. А иначе Scan Tailor глючить начинает - вылетает просто, закрывается с ошибкой (это классический Scan Tailor).
Может есть какая-нить неглючная модификация программы Scan Tailor, которая без проблем позволяет оставить то разрешение, которое было с самого начала?
[Профиль]  [ЛС] 

Gh@nz

Стаж: 18 лет 6 месяцев

Сообщений: 3389


Gh@nz · 25-Фев-25 15:04 (спустя 3 часа)

psikov
Scan Tailor Advanced
[Профиль]  [ЛС] 

psikov

Стаж: 14 лет 11 месяцев

Сообщений: 77


psikov · 25-Фев-25 19:22 (спустя 4 часа)

Gh@nz писал(а):
87446674psikov
Scan Tailor Advanced
А где скачать?
[Профиль]  [ЛС] 

aawaaw

Стаж: 15 лет 11 месяцев

Сообщений: 575


aawaaw · 25-Фев-25 20:13 (спустя 50 мин.)

сводка. надо промотать страницу ЖЖ вниз.
[Профиль]  [ЛС] 

Gh@nz

Стаж: 18 лет 6 месяцев

Сообщений: 3389


Gh@nz · 26-Фев-25 00:16 (спустя 4 часа)

psikov
На руборде. Там все версии.
[Профиль]  [ЛС] 

psikov

Стаж: 14 лет 11 месяцев

Сообщений: 77


psikov · 26-Фев-25 12:32 (спустя 12 часов, ред. 26-Фев-25 12:32)

Спасибо, я скачал архив ScanTailor-Advanced-1.0.19.win-x64.zip (от 16-го июля 2023).
Scan Tailor Advanced 1.0.19 - это, видимо, самая последняя рабочая версия на сегодняшний день.
Попробую.. надеюсь, она неглючная.
UPD:
Что-то не запускается у меня эта прога...
Распаковал архив, при попытке запуска файла scantailor.exe выдает следующую ошибку:
scantailor.exe - Точка входа не найдена
Точка входа в процедуру CreateDXGIFactory2 не найдена в библиотеке DLL dxgi.dll.
[Профиль]  [ЛС] 

aawaaw

Стаж: 15 лет 11 месяцев

Сообщений: 575


aawaaw · 26-Фев-25 14:15 (спустя 1 час 42 мин.)

лучше спрашивать в ветке про ST, там профи
[Профиль]  [ЛС] 

Gh@nz

Стаж: 18 лет 6 месяцев

Сообщений: 3389


Gh@nz · 26-Фев-25 18:04 (спустя 3 часа)

psikov
У вас в системе не все установлено, а вы удивляетесь что у вас что-то крашится.
У меня данная версия работает без проблем.
[Профиль]  [ЛС] 

psikov

Стаж: 14 лет 11 месяцев

Сообщений: 77


psikov · 26-Фев-25 18:57 (спустя 52 мин.)

Gh@nz писал(а):
87451213psikov
У вас в системе не все установлено, а вы удивляетесь что у вас что-то крашится.
Как узнать что именно должно быть установлено в системе?
[Профиль]  [ЛС] 

Gh@nz

Стаж: 18 лет 6 месяцев

Сообщений: 3389


Gh@nz · 26-Фев-25 20:20 (спустя 1 час 22 мин., ред. 26-Фев-25 20:20)

psikov
У каждой проги свои запросы, но как минимум все библиотеки C++ и Framework, DirectX (как в вашем случае).
[Профиль]  [ЛС] 

psikov

Стаж: 14 лет 11 месяцев

Сообщений: 77


psikov · 27-Фев-25 11:16 (спустя 14 часов)

Ладно, тогда уж проще Кромсатор использовать. Кромсатор - он на английском только, русской версии нету?
[Профиль]  [ЛС] 

aawaaw

Стаж: 15 лет 11 месяцев

Сообщений: 575


aawaaw · 27-Фев-25 11:24 (спустя 8 мин.)

в шапке на руборде про русификацию я писал
[Профиль]  [ЛС] 

Gh@nz

Стаж: 18 лет 6 месяцев

Сообщений: 3389


Gh@nz · 27-Фев-25 11:46 (спустя 21 мин., ред. 27-Фев-25 11:46)

psikov
Что вам проще, известно только вам.
На руборде есть тема по Кромсатору, почитайте, там и русификаторы есть.
Хотя что там русифицировать....
А конкретно по проге.... ну, думаю вас еще тут увижу не раз ))).
[Профиль]  [ЛС] 

krauzer7770

Стаж: 13 лет 11 месяцев

Сообщений: 453

krauzer7770 · 18-Апр-25 16:59 (спустя 1 месяц 19 дней)

psikov писал(а):
87442548Посоветуйте, плиз, какую-нить программу для автоматического выравнивания текста. Чтоб на входе в нее загружать изображения или сканы с перекошенным текстом, а в результате она бы делала те же изображения повёрнутыми ровно на тот угол, при котором строки текста параллельны и перпендикулярны.
Какой редактор лучше всего использовать для этого?
ABBYY FineReader умеет все автоматически. Настроек уйма. Для этого она и создавалась, чтобы было все в одном. И сканирование, и обработка, и распознавание, и создание PDF. Как изначально начал сканировать 7 лет назад, так до сих пор и пользуюсь. Сразу отверг все эти "кромсаторы" и другие программы.
[Профиль]  [ЛС] 

petoleg

Top Seed 02* 80r

Стаж: 18 лет 1 месяц

Сообщений: 723

petoleg · 18-Апр-25 20:18 (спустя 3 часа)

krauzer7770 писал(а):
87668659
psikov писал(а):
87442548Посоветуйте, плиз, какую-нить программу для автоматического выравнивания текста. Чтоб на входе в нее загружать изображения или сканы с перекошенным текстом, а в результате она бы делала те же изображения повёрнутыми ровно на тот угол, при котором строки текста параллельны и перпендикулярны.
Какой редактор лучше всего использовать для этого?
ABBYY FineReader умеет все автоматически. Настроек уйма. Для этого она и создавалась, чтобы было все в одном. И сканирование, и обработка, и распознавание, и создание PDF. Как изначально начал сканировать 7 лет назад, так до сих пор и пользуюсь. Сразу отверг все эти "кромсаторы" и другие программы.
Только одно замечание...
При повороте текст становится ступеньками...
[Профиль]  [ЛС] 

Gh@nz

Стаж: 18 лет 6 месяцев

Сообщений: 3389


Gh@nz · 18-Апр-25 23:00 (спустя 2 часа 42 мин.)

petoleg
Человек, явно не поворачивает.
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 6 месяцев

Сообщений: 2671

папаВлад · 19-Апр-25 16:58 (спустя 17 часов)

krauzer7770 писал(а):
87668659ABBYY FineReader умеет все автоматически. Настроек уйма. Для этого она и создавалась, чтобы было все в одном.
ФайнРидер пригоден лишь для распознавания текста, в этом ему нет равных, его движок берут в другие pdf-редакторы, больше не для чего ФайнРидер не пригоден, точнее можно и ещё что-то сделать, но в других программах получается удобнее, качественнее, понятнее.
krauzer7770, если Вам нравится, приспособились, то и пусть будет, никто не против, но советовать, как единственную программу для оцифровки, это зря.
Да, вижу и понимаю, что изначально начали пользоваться ФайнРидером, не посмотрев ни на что другое, но большинство для сканирования использует VueScan, потому что эта программа создана для сканирования изображений, и равных нет, хотя я ей не пользуюсь, мне и родной от сканера достаточно, но VueScan - это космический корабль, загляните на досуге.
Так же и по остальным позициям, где-то фотошоп непобедим, потому что лучший, но пользоваться им тоже не обязательно, и тоже можно найти замену попроще, ну и результат, соответственно, будет попроще. Кстати, если поворачивать в Фотошопе, то будет минимум потерь, как-то slava_kry показывал результаты тестов из разных редакторов, вот и давайте посоветуем Фотошоп, для лучшего результата, хотя и самого медленного.
[Профиль]  [ЛС] 

psikov

Стаж: 14 лет 11 месяцев

Сообщений: 77


psikov · 20-Апр-25 09:40 (спустя 16 часов)

При работе в программе FineReader файлы получаются огромные. Одна отсканированная книга (без распознавания) в формате pdf может весить 200 или 300 мегабайт, даже больше. Разве нет?
И качество изображения хуже, чем если обрабатывать сканы посредством Scan Tailor, а потом конвертировать в pdf.
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 6 месяцев

Сообщений: 2671

папаВлад · 20-Апр-25 11:44 (спустя 2 часа 4 мин.)

psikov
Размер файла на выходе зависит от настроек сжатия, есть регулировки, сжимаем сильнее = меньше размер = хуже картинки.
Также смотрите на дополнительные настройки, которые могут быть полезными, а могут и испортить.
[Профиль]  [ЛС] 

psikov

Стаж: 14 лет 11 месяцев

Сообщений: 77


psikov · 20-Апр-25 14:38 (спустя 2 часа 53 мин.)

папаВлад
Цитата:
Кстати, если поворачивать в Фотошопе, то будет минимум потерь
VueScan, Photoshop - эти программы позволяют одним кликом повернуть большое количество сканов на разные углы - так, чтобы текст на каждом скане стал без наклона? И сохранить их в таком виде
Качество изображений ухудшается при этом?
У меня была когда-то старая версия Фотошоп, но там, кажется, не было вот этой вот функции автоматического выравнивания текста. Вручную - да, любую картинку крути как хочешь, но автоматически - нет, ЕМНИП.
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 6 месяцев

Сообщений: 2671

папаВлад · 20-Апр-25 20:55 (спустя 6 часов)

psikov
VueScan - программа для сканирования, с готовыми сканами - это не сюда.
Про Photoshop точнее расскажут его пользователи, я не знаю подробности про автовыравнивание, если оно есть, то далее возможен пакетный режим.
Просто смотрите, Вы сейчас спрашиваете "Что лучше?", а советы могут быть разными, да и результат тоже разный.
Если сейчас начали использовать Scan Tailor и он вполне устраивает своей скоростью и минимумом ошибок, то возможно завтра узнаете, что при подкручивании в нём теряются некоторые мелкие детали, они размываются, а есть другие программы, но без пакетной обработки, но результат более качественный, вот к этому будьте готовы. Если эти потери не критичны, то не переживайте и продолжайте пользоваться, чем удобнее, но имейте в виду, что это не лучше, а лучший результат добивается кропотливой работой со сканами, и начинается уже на стадии сканирования. Правильное сканирование - пол дела сделано, но и здесь будут разногласия, кому и 300 dpi достаточно, и результат отличный, а другие только на 600, а то и в 1200 сканируют, правда иногда попадаются действительно неадекватные результаты на выходе, пример, обложка первого файла более 3 Мб, зачем и что там разглядывать :/
[Профиль]  [ЛС] 

psikov

Стаж: 14 лет 11 месяцев

Сообщений: 77


psikov · 20-Апр-25 23:47 (спустя 2 часа 51 мин.)

папаВлад
Цитата:
Если сейчас начали использовать Scan Tailor и он вполне устраивает своей скоростью и минимумом ошибок, то возможно завтра узнаете, что при подкручивании в нём теряются некоторые мелкие детали, они размываются, а есть другие программы, но без пакетной обработки, но результат более качественный
Это точно.
Я сейчас использую Scan Tailor Advanced 1.0.19 и результаты вроде бы неплохие, ну, не идеальные конечно... Хотя нутром чую, что надо всё-таки на Кромсатор переходить - это будет ещё лучше...
Цитата:
Правильное сканирование - пол дела сделано, но и здесь будут разногласия, кому и 300 dpi достаточно, и результат отличный, а другие только на 600, а то и в 1200 сканируют
Я обычно сканирую в формат TIFF (несжатый), разрешение 400х400 - по-моему, это оптимальный вариант. После обработки применяется сжатие LZW.
Если есть сложная графика, тогда 600х600, ну а если в исходниках только текст, тогда и 300 (даже 200 dpi) достаточно.
Кстати, VueScan далеко не с каждым устройством может работать, к сожалению. Например, моё МФУ Kyocera FS-1025MFP программа VueScan не поддерживает.
[Профиль]  [ЛС] 

aawaaw

Стаж: 15 лет 11 месяцев

Сообщений: 575


aawaaw · 21-Апр-25 03:56 (спустя 4 часа)

psikov писал(а):
87679296разрешение 400х400 - по-моему, это оптимальный вариант
bolega (автор Сканкромсатора) сильно ругается на мои сканы 400дпи, потому что алгоритмы поднятия разрешения к 600дпи (стандарт для сохранения мелких деталей шрифта, нужных для приятного чтения) не отрабатывают на нецелых коэффициентах как полагается. Приходится 800дпи делать, а это при печати вылазит ступеньками на косых линиях, и размытием на фото, потому что аппаратура принтеров на низший для типографий стандарт спроектирована, это 300дпи и, соответственно, вдвое выше. Потому что железную шестеренку с третью или четвертью зуба не спроектируешь. Из 800 драйвер принтера обязательно будет делать 600 для учёта механики. На дерьмовых драйверах вообще получаются хорошо видимые ступеньки-сдвиги. Полосы от пропущенных строк.
Об этом папаВлад и писал.
[Профиль]  [ЛС] 

Gh@nz

Стаж: 18 лет 6 месяцев

Сообщений: 3389


Gh@nz · 21-Апр-25 12:38 (спустя 8 часов)

папаВлад
Цитата:
Так же и по остальным позициям, где-то фотошоп непобедим, потому что лучший, но пользоваться им тоже не обязательно, и тоже можно найти замену попроще, ну и результат, соответственно, будет попроще. Кстати, если поворачивать в Фотошопе, то будет минимум потерь, как-то slava_kry показывал результаты тестов из разных редакторов, вот и давайте посоветуем Фотошоп, для лучшего результата, хотя и самого медленного.
Это все про результат.
Кого какой результат устраивает, тот и использует соответствующий набор инструментов.
Зачем снова сравнивать вилку с бутылкой.....
[Профиль]  [ЛС] 

Mags2020

Стаж: 5 лет 4 месяца

Сообщений: 39

Mags2020 · 25-Апр-25 00:04 (спустя 3 дня, ред. 25-Апр-25 00:04)

Насчет выравнивания контента (deskew), есть следующие тонкости и нюансы.
- ScanTailor слегка размывает картинку, что плохо для журнальных сканов в 300dpi, но нормально для книг с бинаризацией в 600dpi.
- ScanKromsator имеет настройки метода поворота. Дольше и качественнее - Deskew method: Antialias, Resample filter: Bicubic.
- Есть еще неупомянутый Deskew Tools, тоже с качественным поворотом (Bicubic, Lanczos), не требующий изучения Кромсатора.
Photoshop не выравнивает страницы в автоматическом режиме, по крайней мере в знакомых мне версиях.
По разрешению сканов есть теория, что оно должно быть кратно оптическому разрешению сканера - если оно 1600, оптимально сканить в 400 и 800, а если 1200, то лучше в 300 и 600.
Сравните растровые розетки картинок на сканах в разном разрешении - они должны быть ровными и четкими, а если дерганые и некрасивые - разрешение неподходящее.
[Профиль]  [ЛС] 

SI{AY

Стаж: 17 лет 3 месяца

Сообщений: 1352

SI{AY · 25-Апр-25 00:45 (спустя 41 мин.)

Mags2020 писал(а):
87696382По разрешению сканов есть теория
Так что там алгоритмы на этапе сканирования, что потом алгоритмы на этапе обработки. Даже CS у Adobe Заточен под конкретные dpi )
[Профиль]  [ЛС] 

malshin

Стаж: 17 лет 8 месяцев

Сообщений: 1293


malshin · 25-Апр-25 20:17 (спустя 19 часов)

Mags2020 писал(а):
87696382Насчет выравнивания контента (deskew), есть следующие тонкости и нюансы.
Photoshop не выравнивает страницы в автоматическом режиме, по крайней мере в знакомых мне версиях.
Не выравнивает. Но можно используя макрос сделать поворот на нужный угол группы сканов.
[Профиль]  [ЛС] 

psikov

Стаж: 14 лет 11 месяцев

Сообщений: 77


psikov · 25-Апр-25 20:54 (спустя 36 мин.)

aawaaw писал(а):
87679719Приходится 800дпи делать, а это при печати вылазит ступеньками на косых линиях, и размытием на фото, потому что аппаратура принтеров на низший для типографий стандарт спроектирована, это 300дпи и, соответственно, вдвое выше.
Цитата:
Из 800 драйвер принтера обязательно будет делать 600 для учёта механики. На дерьмовых драйверах вообще получаются хорошо видимые ступеньки-сдвиги. Полосы от пропущенных строк.
Специально чтобы это проверить распечатал файл pdf, созданный из сканов в формате TIFF с разрешением 800х800 и сжатием LZW. Результатом доволен. Пропущенные строки, размытые рисунки, ступеньки на косых линиях, сдвиги и т.п. - нет ничего такого! Буквы, строки, рисунки, косые линии - отлично пропечаталось всё. Видимо, тут многое от принтера зависит, а не от разрешения сканов...
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error