Как быстро создать книгу в формате DjVu

Страницы:  1
Ответить
 

sam911_

Стаж: 15 лет 8 месяцев

Сообщений: 79


sam911_ · 20-Дек-11 13:23 (12 лет 10 месяцев назад, ред. 07-Мар-12 12:44)

Как быстро создать книгу в формате djvu
Хоть уже и существуют неплохие мануалы по этой теме, но, на мой взгляд, они перегружены тонкостями цифровой обработки изображений, и довольно сложны для освоения, я решил написать самую краткую инструкцию, доступную для новичков.
Если у вас есть оригинальные, цветные или серые, необработанные сканы, желательно 300 dpi, то вам понадобятся программы:
Scan Tailor
DjVu Small v0.4.4
DJVU Document Express Editor 6.0.1 LE
ST Split v1.3
DjVu Imager v2.9
Для начала сканы обрабатываем программой Scan Tailor, сканы будут автоматически разрезаны, выровнены и бинаризированы, от пользователя потребуется только проверить правильность расстановки резака и выделения полезной области перетаскиванием рамок, 1-5 страниц, в зависимости от качества, могут быть выделены неправильно.
На выходе получаем набор tiff файлов в 600 dpi, которые кодируем с помощью программы DjVu Small с профилем default.
Обложки обрабатываем отдельно, обрезать их можно в любом графическом редакторе, например, Microsoft Office Picture Manager. Кодируем их программой DjVu Small с профилем scanned 200 (чем больше значение, тем больше сжатие, чем меньше, тем лучше качество), а в опциях, в закладке кодировать в DjVu, ставим dpi + 300, если одна из сторон обложки меньше 1000 пикселей, то кодируем с профилем foto.
Объединяем это все с помощью DJVU Document Express Editor.
Если в книге есть иллюстрации, то на выходе Scan Tailor ставим режим смешанный, лучше если это будет установлено не для всего проекта в целом, а для каждой страницы с иллюстрацией отдельно.
После окончания обработки сканов разделяем ч\б и цветные страницы программой ST Split, в ней просто указать папку out проекта скантейлора. На выходе получаем папку 1 и 2, в первой папке ч\б сканы, их кодируем DjVu Small с профилем default, содержимое папки 2 кодируется и вставляется программой DjVu Imager с включенном параметром ДЗФ 3 (чем больше цифра тем больше сжатие).
Видео урок по Скантейлору http://vimeo.com/12527484
[Профиль]  [ЛС] 

sam911_

Стаж: 15 лет 8 месяцев

Сообщений: 79


sam911_ · 17-Фев-12 15:45 (спустя 1 месяц 28 дней)


Выкинь FineReader,
Забей на Adobe,
Установи ScanTailor + DjVu Small,
И вперед!
[Профиль]  [ЛС] 

xUnlimitedx

Стаж: 15 лет 3 месяца

Сообщений: 518


xUnlimitedx · 28-Фев-12 19:42 (спустя 11 дней)

sam911_, Спасибо за инструкцию! Для тебя - маленький мануал, а для меня - большой шаг в мир книгосканирования.
[Профиль]  [ЛС] 

Полиграфолог

Стаж: 13 лет

Сообщений: 97

Полиграфолог · 15-Авг-12 14:26 (спустя 5 месяцев 15 дней)

Почему выкинуть FineReader?
Имеено там есть оптимальные настройки для быстрого сканирования. К тому же удобное распознавание текста. И там же можно всё свести в дежавю или пдф или ещё 100 тыщ форматов. 1 программа заменяет 3.
[Профиль]  [ЛС] 

sam911_

Стаж: 15 лет 8 месяцев

Сообщений: 79


sam911_ · 21-Авг-12 14:23 (спустя 5 дней)

Полиграфолог FineReader не предназначен для обработки сканов, лишь для распознавания текста. Большинство созданных FineReader"ом пдф (текст+картинки), в особенности науч.-техн. литературу, можно викидывать сразу, если только не вычитывать каждую страницу в отдельности, да и то, это не будет гарантировать аутентичности оригиналу.
[Профиль]  [ЛС] 

Полиграфолог

Стаж: 13 лет

Сообщений: 97

Полиграфолог · 22-Авг-12 06:27 (спустя 16 часов)

Цитата:
можно викидывать сразу
Что, прям выкидывать? По-моему никакой разницы с DJVU Document Express Editor
Цитата:
FineReader не предназначен для обработки сканов, лишь для распознавания текста.
Пятая версия была предназначена только для распознавания. В 11й возможности обработки много больше
скрытый текст
[Профиль]  [ЛС] 

sam911_

Стаж: 15 лет 8 месяцев

Сообщений: 79


sam911_ · 22-Авг-12 16:30 (спустя 10 часов)


Сканы перед кодированием надо обрабатывать, текст бинаризировать, а иллюстрации вырезать из страницы, кодируется оно в разных режимах, а потом соединяется. Так получается DjVu с высоким качеством как текста так и иллюстраций при минимальном размере. Файнридер не имеет ни пакетной обработки, ни вышеописанной функции. Есть программы которые специально предназначены под обработку графических файлов, сканов, для последующего создания DjVu, и этот процесс занимает меньше времени, и выдает более качественный результат, чем при других методах обработки и создания DjVu.
Вот пример книга с большим количеством иллюстраций в pdf весит 500 mb https://rutr.life/forum/viewtopic.php?t=3860200
после обработки 10 mb http:// СПАМ при идентичном качестве.
[Профиль]  [ЛС] 

tih851023

Стаж: 15 лет 10 месяцев

Сообщений: 43


tih851023 · 10-Сен-12 19:43 (спустя 19 дней)

А не подскажете пакт, которым можно было бы обрабатывать сканы, предназначенный именно для этой цели, и желательно чтобы там сразу же можно было бы собрать в книгу, не обязательно djvu, можно pdf, файн ридер действительно для этой цели не предназначен. Хотя за неимением (или не знанием) спец пакета, приходится юзать именно его. Заранее благодарен.
[Профиль]  [ЛС] 

Qwertypz

Старожил

Стаж: 15 лет 8 месяцев

Сообщений: 1303

Qwertypz · 12-Ноя-12 20:51 (спустя 2 месяца 2 дня)

sam911_ писал(а):
Вот пример книга с большим количеством иллюстраций в pdf весит 500 mb https://rutr.life/forum/viewtopic.php?t=3860200
после обработки 10 mb http:// СПАМ при идентичном качестве.
Я только замечу, что в Акробате можно оптимизировать пдф как вам надо и получается читабельный файл, но весом в несколько раз меньше (я попробовал навскидку и получилось в 3 Мб вместо 27). И OCR там же делается. В приведенном примере получилось бы около 50 Мб вместо 500, что уже куда лучше .
[Профиль]  [ЛС] 

rioter11

Top Seed 04* 320r

Стаж: 17 лет 3 месяца

Сообщений: 1654

rioter11 · 24-Ноя-12 22:49 (спустя 12 дней)

Qwertypz писал(а):
56289087
sam911_ писал(а):
Вот пример книга с большим количеством иллюстраций в pdf весит 500 mb https://rutr.life/forum/viewtopic.php?t=3860200
после обработки 10 mb http:// СПАМ при идентичном качестве.
Я только замечу, что в Акробате можно оптимизировать пдф как вам надо и получается читабельный файл, но весом в несколько раз меньше (я попробовал навскидку и получилось в 3 Мб вместо 27).
И OCR там же делается. В приведенном примере получилось бы около 50 Мб вместо 500, что уже куда лучше .
a вот что можно сделать с этим 500 метровым файлом BookRestorer (бинаризация) Акробат (ClearScan)
= чистый белый фон текстовый слой очень приличный вид и текста и иллюстраций на 25 мб
rusfolder.net
[url=http://narod.ru/disk/63974424001.a20694f71acc4f43924a39f1421e2e7a/Яхонт О.В. - Проблемы консервации реставрации и атрибуции произведениÐ.html]narod.ru[/url]
а можно сжать и до 9 мб (текст такой же а вот картинки незначительно размылись)
rusfolder.net
[url=http://narod.ru/disk/63974500001.a14ac584d047acd0d03e15b4535dc99c/Яхонт О.В. - Проблемы консервации реставрации и атрибуции произведениÐ.html]narod.ru[/url]
[Профиль]  [ЛС] 

Olej96on

Стаж: 14 лет 9 месяцев

Сообщений: 3


Olej96on · 01-Мар-13 12:52 (спустя 3 месяца 4 дня)

sam911_ писал(а):
51260098

Выкинь FineReader,
Забей на Adobe,
Установи ScanTailor + DjVu Small,
И вперед!
Поддерживаю, а за одно Выкинь и Забей Винду новую, а Установи древние програмы, которые работают с древней осью! DjVu Small с 7 не работает! Чем прикажите кодировать djvu?
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 7 месяцев

Сообщений: 1179


Shassukkum · 01-Мар-13 18:33 (спустя 5 часов)

Olej96on писал(а):
DjVu Small с 7 не работает!
Какой битности?
[Профиль]  [ЛС] 

Olej96on

Стаж: 14 лет 9 месяцев

Сообщений: 3


Olej96on · 02-Мар-13 12:37 (спустя 18 часов)

64 битность. С короткими через бубен работает. Где-то до 40 tiff-файлов собирает, предварительно зависнув. При закрытии программы, появляется djvu файл.
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 7 месяцев

Сообщений: 1179


Shassukkum · 02-Мар-13 14:30 (спустя 1 час 53 мин.)

Странно. Я ставил чистую 64-ю винду, без всяких урезок и пр. хлама сверху, не самопал. Всё нормально шло. Попробуйте DjVu Small Mod.
[Профиль]  [ЛС] 

KrRig

Стаж: 12 лет 6 месяцев

Сообщений: 49

KrRig · 06-Апр-13 09:32 (спустя 1 месяц 3 дня, ред. 06-Апр-13 09:32)

sam911_ писал(а):
Если у вас есть оригинальные, цветные или серые, необработанные сканы, желательно 300 dpi, то вам понадобятся программы:
Scan Tailor
DjVu Small v0.4.4
DJVU Document Express Editor 6.0.1 LE
ST Split v1.3
DjVu Imager v2.9
ST Split v1.3 уже не нужен, его функции встроены в Scan Tailor Featured
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error