FAQ по сборке (созданию) DjVu книги из сырых сканов

Страницы :   Пред.  1, 2, 3 ... 35, 36, 37 ... 39, 40, 41  След.
Ответить
 

OlegZ

Стаж: 16 лет 10 месяцев

Сообщений: 788


OlegZ · 24-Ноя-16 21:04 (8 лет 5 месяцев назад, ред. 24-Ноя-16 22:23)

Кто-нибудь подскажет как вот это
убрать в фотошопе или любом другом редакторе в автоматическом режиме (для всех сканов)? Размер этой "кляксы" 14х8 пикселей. Можно конечно оставить и так, но что-то мешает.
папаВлад писал(а):
71851097
OlegZ писал(а):
71849925P.P.S "Зарядил" 1000 стр. в адоб акробат ди-си.
Погодите, всё неправильно делаете, это не клеарскан, у Вас стоит галка на адаптивном сжатии, надо снять. И вообще, правильный клеарскан делается не так. Изначально в акробате в настройках тифа установите сжатие зип, получите огромный пдф. Возможно, Ваш слабый комп не сможет его сохранить, тогда надо собирать частями, к примеру по 50 страниц. И после накладывать клеарскан с понижением картинок до 300 дпи.
А ещё хочу сказать, что вариант с адаптивным сжатием тоже можно делать, это для тех, кому не нравится действие клеарскана, но нужно проверять не испортились ли картинки, обычно из 600 с адаптивным сжатием выходит хорошо, но разрешение понижается до 300 при максимальном качестве, а нам выше и не надо. Единственная неприятность может быть для мелкого шрифта, а на Ваших образцах мелкого нет.
OlegZ, давайте поступим так, Вы дождитесь окончания сжатия, которое сейчас идёт, и сохраните результат, потом сделаем второй файл с клеарсканом, я ещё раз покажу подробно, получим меньший по-размеру файл.
Подскажите, пожалуйста, по шагам как оптимально закодировать в PDF это изображение: https://yadi.sk/i/u23t2gAjzQLUB ? В djvu кодируется значительно оптимальнее: https://yadi.sk/i/_7AUvLtLzQLph (размер 18 кБ).
[Профиль]  [ЛС] 

Loexa

Стаж: 15 лет 5 месяцев

Сообщений: 561

Loexa · 24-Ноя-16 21:53 (спустя 48 мин.)

Можно вот по этому алгоритму: https://rutr.life/forum/viewtopic.php?p=70186475#70186475
У меня есть скриптик для GIMP, но его нужно подшаманивать под каждый конкретный случай.
Киньте парочку грязных страниц, я посмотою.
[Профиль]  [ЛС] 

OlegZ

Стаж: 16 лет 10 месяцев

Сообщений: 788


OlegZ · 24-Ноя-16 22:27 (спустя 34 мин., ред. 24-Ноя-16 22:39)

Loexa писал(а):
71892484Можно вот по этому алгоритму: https://rutr.life/forum/viewtopic.php?p=70186475#70186475
У меня есть скриптик для GIMP, но его нужно подшаманивать под каждый конкретный случай.
Киньте парочку грязных страниц, я посмотою.
https://yadi.sk/i/PvZSvLtIzQMRR , https://yadi.sk/i/u23t2gAjzQLUB . Скриптом можете поделиться?
P.S. Этот алгоритм для автоматизации не подходит.
[Профиль]  [ЛС] 

Loexa

Стаж: 15 лет 5 месяцев

Сообщений: 561

Loexa · 25-Ноя-16 00:22 (спустя 1 час 54 мин., ред. 25-Ноя-16 21:50)

Цитата:
Скриптом можете поделиться?
https://cloud.mail.ru/public/7PAu/j4HsJXg8L
Выйти из GIMP, найти папку "plugins", положить туда скрипт. При повторном открытии он появится в пункте меню "Shortcuts".
Если ещё не имеете GIMP, то лучше поставьте GIMP Portable — у него все файлы лежат вместе, а не разбросаны по системе, будет удобнее в "потрохах" ковыряться. И ещё поставьте плагин BIMP для пакетной обработки.
Цитата:
Этот алгоритм для автоматизации не подходит
Подходит, с некоторой модификацией.
Для лучшего качества можно прогнать сначала через фильтр "Selective Gaussian Blur" (радиус 3, порог порядка 100) — он размоет мелкую мельтешню.
Стр.0004 и подобные придётся обработать вручную.
Тонкие красные линии внизу страницы удаляются вместе с мусором. Тоже придётся вручную восстанавливать. Если они на всех страницах, то можно автоматизировать восстановление.
Ну и, конечно, новые файлы сохранять в новую папку, а не затирать ими старые. Чтобы всегда можно было откатиться.
[Профиль]  [ЛС] 

OlegZ

Стаж: 16 лет 10 месяцев

Сообщений: 788


OlegZ · 25-Ноя-16 15:40 (спустя 15 часов, ред. 27-Ноя-16 13:27)

Ну что же, "первый блин" готов. Не прошло и 20 дней . Как только добавлю оглавление, создам раздачу. Размер в djvu 1002 страничной книги со 125-ю изображениями получился 37 МБ (без оглавления). Всем, кто старался помочь, поклон.

P.S. Хочется добавить в раздачу эту же книгу в pdf. Как только разберусь с clear scan в акробате и отредактирую ошибки распознавания, Бог благословит, выложу эту книгу.
[Профиль]  [ЛС] 

_Sokrat87_

VIP (Заслуженный)

Стаж: 16 лет 5 месяцев

Сообщений: 4396

_Sokrat87_ · 17-Дек-16 16:04 (спустя 22 дня)

DjVu-Master
Ссылка наверно стоит заменить в инструкции по оглавлению на новую https://sourceforge.net/projects/handyoutlinerfo/
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 15 лет 4 месяца

Сообщений: 6135

DjVu-Master · 31-Дек-16 13:06 (спустя 13 дней, ред. 31-Дек-16 13:06)

_Sokrat87_ писал(а):
72048487DjVu-Master
Ссылка наверно стоит заменить в инструкции по оглавлению на новую https://sourceforge.net/projects/handyoutlinerfo/
Заменил.
З.Ы. Если нужен код / [code] 1-го и 2-го сообщений этой темы для того о чем вы мне писали в ЛС - то могу скинуть. В общем пишите в ЛС.
Всех с наступающим НГ!!!!!
[Профиль]  [ЛС] 

_Sokrat87_

VIP (Заслуженный)

Стаж: 16 лет 5 месяцев

Сообщений: 4396

_Sokrat87_ · 31-Дек-16 17:52 (спустя 4 часа)

DjVu-Master писал(а):
72138193Заменил
Спасибо.
Цитата:
З.Ы. Если нужен код / [code] 1-го и 2-го сообщений этой темы для того о чем вы мне писали в ЛС - то могу скинуть. В общем пишите в ЛС.
У модераторов кнопочка специальная есть
[Профиль]  [ЛС] 

qzerss

Стаж: 12 лет 11 месяцев

Сообщений: 254


qzerss · 26-Янв-17 01:56 (спустя 25 дней)

Подскажите, как и чем можно перевести книгу с формата pdf в формат djvu - желательно без потерь.
Может есть какая программка - а я и не знаю...
Или все таки нужно прогонять через Скантейлор?
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 4 месяца

Сообщений: 2650

папаВлад · 26-Янв-17 06:36 (спустя 4 часа)

qzerss
Тоже недавно озадачился, потестировал, оказалось фигня эти программы по автоконвертации, правильнее разобрать пдф на тифы и потом в дежавю собрать с нужными настройками кодирования в каком-нибудь Djvu Small Mod.
СканТэйлор не понадобится.
--
Я так думаю, чтоб Вам не изучать премудрости дежавю, можно для Skaramusch отправить просто пдф или обработанные тифы, он-то точно знает, как с ними поступить.
[Профиль]  [ЛС] 

slava_kry

Стаж: 18 лет

Сообщений: 245


slava_kry · 26-Янв-17 07:53 (спустя 1 час 17 мин.)

qzerss
Насколько помню, если ПДФ сделан правильно (картинки выделены, текст отдельно), то его можно открыть в СК и всё будет правильно распознано.
Если же ПДФ это простое сборище картинок, то лучше пересобрать.
[Профиль]  [ЛС] 

qzerss

Стаж: 12 лет 11 месяцев

Сообщений: 254


qzerss · 26-Янв-17 11:49 (спустя 3 часа, ред. 26-Янв-17 11:49)

папаВлад писал(а):
72344385с нужными настройками кодирования в каком-нибудь Djvu Small Mod.
А вы случайно не тестировали.
Может подскажете настройки?
Я к примеру думаю, по вашему предыдущему совету - Экстремальные - малоцветное кодирование
Где-то экспериментировал в Экстремальном с разными параметрами - забыл сохранить результат, не совсем правильно Small Mod кодировал - наложение (которое делал в фотошопе) почему-то не прошло правильно после кодирования- было смещение на пару миллиметров - соответственно часть букв была черной.
Я тоже давно искал программку - и опять возникла необходимость - так и ничего из программ не нашел.
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 4 месяца

Сообщений: 2650

папаВлад · 26-Янв-17 16:30 (спустя 4 часа)

qzerss писал(а):
72345674А вы случайно не тестировали.
Да вот им теперь и делаю дежавю.
qzerss писал(а):
72345674Может подскажете настройки?
Э, нет, там нужно под разные моменты разные настройки, самое простое ч/б текст, под него почти все пункты подходят, остальное тестируйте, ли бо подправляйте в глубине программы под себя, например я для журнала Огонёк подкрутил и сохранил, теперь все эти журналы кодируются с одной настройкой, хотя это не совсем правильно, зато быстро и не нужно под каждую страницу что-то менять.
Погодите чуток, сейчас настоящие дежавьюрщики подойдут, вот тогда будут разъяснения более полезные.
Вы бы написали или показали, что собираетесь сжимать, для дальнейших советов.
[Профиль]  [ЛС] 

qzerss

Стаж: 12 лет 11 месяцев

Сообщений: 254


qzerss · 26-Янв-17 17:07 (спустя 37 мин.)

Да просто книгу перегнать из pdf в формат djvu.
Минимум в ней будет Обложка и задник - цветные .
Максимум - попадутся ещё картинки по книге.
Это будет применяться ко многим книгам - хотят просто иметь книги в djvu.
Вот я и думаю - как этот Small Mod будет кодировать это все дело.
Наверное если его настроить на Экстремальные - Рукопись - он сможет закодировать все без сильных потерь - чтоб картинки отдельно не кодировать - ведь тогда уж проще прогонять в СТ.
Я думаю цветной текст в книгах будет редко встречаться - в основном ведь хочется чтоб картинки не очень пострадали.
Вот и хочу выбрать что-то более менее среднее к общей прогонке.
Жаль нет такой программы как DjVuToy - вот она прекрасно справляется из djvu в pdf ...
А мне бы обратно...
[Профиль]  [ЛС] 

aawaaw

Стаж: 15 лет 10 месяцев

Сообщений: 560


aawaaw · 26-Янв-17 17:36 (спустя 28 мин.)

qzerss
Цитата:
Это будет применяться ко многим книгам - хотят просто иметь книги в djvu.
О боже... опять пакетная обработка. "Как бы так вывернуться, чтоб и рыбку съесть, на ..й не сесть". Анекдот такой был.
Это пакетом - качественно - НЕ работает. Принципиально. Форматы разные по устройству. Индивидуально - хоть СК, хоть DSM, по мне так без разницы. Если пакетно - то вряд ли вы вообще услышите лучший совет, кроме как найти веб-конвертилки. Дёшево и сердито.
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 4 месяца

Сообщений: 2650

папаВлад · 26-Янв-17 19:30 (спустя 1 час 53 мин.)

qzerss
Обложки по DPI одинаковы с текстовым блоком? Просто обычно обложки и полностраничные иллюстрации оставляют на 300, а текст на 600 DPI. Я бы скинул Вам свой профиль от Огонька, он на сохранение иллюстраций заточен (но не в фото, будут чуть заметные погрешности), а текст - он и в Африке останется текстом, но если есть разница по DPI, то я не знаю какой результат получится на страницах в 300 DPI.
В общем, пробуйте https://yadi.sk/d/x7Rp6nxa3B5Lau профиль Ogonek 600. По уму бы то, что на 300, то и кодировать на 300, а потом клеить с текстовым блоком, но Djvu Small Mod не умеет клеить дежавю, пользуюсь старинным Document Express Editor 6.0.1.1320 Rus (portable).
Всё что знаю написал, если ничего непонятно, попробуйте кромсатор, про него ничего не знаю, но ребята подскажут.
[Профиль]  [ЛС] 

rioter11

Top Seed 04* 320r

Стаж: 17 лет 9 месяцев

Сообщений: 1644

rioter11 · 26-Янв-17 22:50 (спустя 3 часа, ред. 26-Янв-17 22:50)

я использую Pdf 2 Djvu Converter,
подхватывает и букмарки и текстовый слой который у меня от Clearscan-а
видеоруководство на YouTube
[Профиль]  [ЛС] 

qzerss

Стаж: 12 лет 11 месяцев

Сообщений: 254


qzerss · 27-Янв-17 00:00 (спустя 1 час 9 мин., ред. 27-Янв-17 00:00)

slava_kry
aawaaw
папаВлад
rioter11
Спасибо.
Буду пробовать.
Мне ещё советовали собирать тифы в DjVu Solo.
rioter11 писал(а):
72349590и текстовый слой который у меня от Clearscan
Вот же интересно - кроме Clearscan - я ничего практичного не нашел для вставки распознанного слоя (пару программ тестировал).
И чтоб перенести этот слой без потери в djvu - есть конвертер, а вот чтоб из djvu в pdf перенести качественно вшитый слой - нету. Качественно переводит только скан, и букмарки подхватывает - но не слой (это я говорю о DjVuToy) .
[Профиль]  [ЛС] 

aawaaw

Стаж: 15 лет 10 месяцев

Сообщений: 560


aawaaw · 27-Янв-17 04:58 (спустя 4 часа)

qzerss
Цитата:
собирать тифы в DjVu Solo
Если photo-профилем.
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 4 месяца

Сообщений: 2650

папаВлад · 27-Янв-17 11:59 (спустя 7 часов)

qzerss
Какая-то сложная у Вас схема, как Вы книги собираете?
Сканы в дежавю через DjVuToy, потом им же конвертируете в пдф, потом чем-то, например акробатовским клеарсканом наложили текст и потом нужно обратно в дежавю и чтоб с текстом. Так чтоль?
А не проще будет просто подложить текст на дежавю. Из ФайнРидера будет качественней акробата.
[Профиль]  [ЛС] 

qzerss

Стаж: 12 лет 11 месяцев

Сообщений: 254


qzerss · 27-Янв-17 15:41 (спустя 3 часа)

папаВлад
не-е-е...
Я просто удивлялся - как для одного формата - есть выход из положения а для другого нету.
К примеру - качественно вшить текст в DjVu - без разницы какого качества скан - есть - fr11DTLcrutch
А вот в pdf - только при качественном скане хорошо получается у Clearscan а в других программах постоянные артефакты.
И чтоб перевести из DjVu в pdf - тоже есть DjVuToy - а вот обратно, нету.(или почти нету - надо поэкспериментировать с Pdf 2 Djvu Converter)
У меня сборка такая как описано в этом FAQ-е по сборке.
Я вообще-то в последнее время со слоем вообще не заморачиваюсь - только если просят.
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 4 месяца

Сообщений: 2650

папаВлад · 27-Янв-17 17:23 (спустя 1 час 41 мин.)

qzerss писал(а):
72353526Я просто удивлялся - как для одного формата - есть выход из положения а для другого нету.
Все выходы есть, надо искать, пусть и длинный лабиринт, так оцифровка книг - это как квест.
qzerss писал(а):
72353526К примеру - качественно вшить текст в DjVu - без разницы какого качества скан - есть - fr11DTLcrutch
Чтоб перенести текст из пдф в пдф есть связка ФайнРидера и callas pdfToolbox 5, сам пользуюсь, могу видео записать, как раз сейчас делаю. (записал, полное описание процесса там)
qzerss писал(а):
72353526А вот в pdf - только при качественном скане хорошо получается у Clearscan а в других программах постоянные артефакты.
Плохо понял о чём речь. Ч/б или скан-картинки? Если жмёте не бинаризованные файлы, то конечно получаете артефакты при сжатии jpeg, а если уже бинаризованы, то артефактов не будет. Хотя есть исключение - картинка с текстом, но и тут можно выкрутиться, например заморочится с Файнридером и использовать его MRC-сжатие, правда оно может и на картинку залезть, как повезёт. И PDF Transformer+ умеет MRC наложить, но это на вкус и цвет, я редко использую.
Для примера, на этой книге вообще не делал бинаризацию, проще было в ФР с MRC собрать, а то в СТ либо жирный текст слипался, либо тонкий исчезал, а так всё сохранилось как в книге.
qzerss писал(а):
72353526И чтоб перевести из DjVu в pdf - тоже есть DjVuToy - а вот обратно, нету.(или почти нету - надо поэкспериментировать с Pdf 2 Djvu Converter)
Пробуйте, видите и rioter11 пользуется, мне эта прога не подошла для журнала Огонёк, может с текстом будет легче справиться.
qzerss, будут примеры, порешаем. Сколько оцифровщиков, столько и выходов найдёте
[Профиль]  [ЛС] 

_Sokrat87_

VIP (Заслуженный)

Стаж: 16 лет 5 месяцев

Сообщений: 4396

_Sokrat87_ · 27-Янв-17 17:53 (спустя 30 мин.)

Господа, может поколдуете, когда раздача появится?
https://rutr.life/forum/viewtopic.php?t=5093876
Почти гиг..
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 4 месяца

Сообщений: 2650

папаВлад · 27-Янв-17 22:15 (спустя 4 часа)

_Sokrat87_
Обратите внимание на этот скриншот, там возни с восстановлением утраченного текста немерено будет.
Есть ещё файл, правда тоже не ахти, где-то на 150 DPI, но хоть все буквы на месте.
Перезалил на временную ссылку, когда-нибудь удалю.
Источник
Я бы оставил ту раздачу без изменений, там действительно картинки будут лучше, а Вы решайте на своё усмотрение.
[Профиль]  [ЛС] 

_Sokrat87_

VIP (Заслуженный)

Стаж: 16 лет 5 месяцев

Сообщений: 4396

_Sokrat87_ · 27-Янв-17 23:07 (спустя 52 мин.)

папаВлад
Ок, спасибо!
[Профиль]  [ЛС] 

qzerss

Стаж: 12 лет 11 месяцев

Сообщений: 254


qzerss · 03-Фев-17 16:14 (спустя 6 дней)

OlegZ писал(а):
71892106Кто-нибудь подскажет как вот это
убрать в фотошопе или любом другом редакторе в автоматическом режиме (для всех сканов)?
Хотел бы поднять этот вопрос повторно.
Списывался с OlegZ - он этот метод не применял.
Как-то не могу найти решение.
Читал о скрипте
Loexa писал(а):
71892817Выйти из GIMP, найти папку "plugins", положить туда скрипт. При повторном открытии он появится в пункте меню "Shortcuts".
Если ещё не имеете GIMP, то лучше поставьте GIMP Portable — у него все файлы лежат вместе, а не разбросаны по системе, будет удобнее в "потрохах" ковыряться. И ещё поставьте плагин BIMP для пакетной обработки.
Что-то не получается его увидеть в программе - помогите разобраться (у меня GIMP Portable стоит)
А вот что обрабатывал - и что получилось

Вот исходники - http://www.fayloobmennik.net/6841424
Если есть другой выход из положения - буду очень признателен (с учетом что нужна пакетная обработка)
[Профиль]  [ЛС] 

Loexa

Стаж: 15 лет 5 месяцев

Сообщений: 561

Loexa · 03-Фев-17 18:23 (спустя 2 часа 8 мин., ред. 03-Фев-17 18:23)

Цитата:
Что-то не получается его увидеть в программе - помогите разобраться (у меня GIMP Portable стоит)
File -> Batch Image Manipulation.
Цитата:
Читал о скрипте
Скрипт нужно под каждый конкретный случай рисовать.
[Профиль]  [ЛС] 

qzerss

Стаж: 12 лет 11 месяцев

Сообщений: 254


qzerss · 03-Фев-17 20:05 (спустя 1 час 41 мин.)

Loexa писал(а):
72405870Скрипт нужно под каждый конкретный случай рисовать.
В моем случае подойдет?
Я кидаю скрипт и плагин по пути GIMPPortable\Data\gegl-0.2\plug-ins
И в File -> ничего не вижу

Может есть какой другой способ убрать цветной мусор?
[Профиль]  [ЛС] 

Loexa

Стаж: 15 лет 5 месяцев

Сообщений: 561

Loexa · 03-Фев-17 20:21 (спустя 16 мин.)

Цитата:
Я кидаю скрипт и плагин по пути GIMPPortable\Data\gegl-0.2\plug-ins
Точно не туда. Где-то тут: Program Files/GIMPPortable/App/gimp/lib/gimp/2.0/plug-ins
Цитата:
Может есть какой другой способ убрать цветной мусор?
Я не понял, мусор цветной или ч-б?
[Профиль]  [ЛС] 

qzerss

Стаж: 12 лет 11 месяцев

Сообщений: 254


qzerss · 03-Фев-17 20:45 (спустя 23 мин.)

Loexa писал(а):
72406737Я не понял, мусор цветной или ч-б?
Тут и ч\б и цветной мусор.
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error