|
OlegZ
Стаж: 16 лет 10 месяцев Сообщений: 788
|
OlegZ ·
24-Ноя-16 21:04
(8 лет 5 месяцев назад, ред. 24-Ноя-16 22:23)
Кто-нибудь подскажет как вот это
убрать в фотошопе или любом другом редакторе в автоматическом режиме (для всех сканов)? Размер этой "кляксы" 14х8 пикселей. Можно конечно оставить и так, но что-то мешает.
папаВлад писал(а):
71851097
OlegZ писал(а):
71849925P.P.S "Зарядил" 1000 стр. в адоб акробат ди-си.
Погодите, всё неправильно делаете, это не клеарскан, у Вас стоит галка на адаптивном сжатии, надо снять. И вообще, правильный клеарскан делается не так. Изначально в акробате в настройках тифа установите сжатие зип, получите огромный пдф. Возможно, Ваш слабый комп не сможет его сохранить, тогда надо собирать частями, к примеру по 50 страниц. И после накладывать клеарскан с понижением картинок до 300 дпи.
А ещё хочу сказать, что вариант с адаптивным сжатием тоже можно делать, это для тех, кому не нравится действие клеарскана, но нужно проверять не испортились ли картинки, обычно из 600 с адаптивным сжатием выходит хорошо, но разрешение понижается до 300 при максимальном качестве, а нам выше и не надо. Единственная неприятность может быть для мелкого шрифта, а на Ваших образцах мелкого нет.
OlegZ, давайте поступим так, Вы дождитесь окончания сжатия, которое сейчас идёт, и сохраните результат, потом сделаем второй файл с клеарсканом, я ещё раз покажу подробно, получим меньший по-размеру файл.
Подскажите, пожалуйста, по шагам как оптимально закодировать в PDF это изображение: https://yadi.sk/i/u23t2gAjzQLUB ? В djvu кодируется значительно оптимальнее: https://yadi.sk/i/_7AUvLtLzQLph (размер 18 кБ).
|
|
Loexa
 Стаж: 15 лет 5 месяцев Сообщений: 561
|
Loexa ·
24-Ноя-16 21:53
(спустя 48 мин.)
Можно вот по этому алгоритму: https://rutr.life/forum/viewtopic.php?p=70186475#70186475
У меня есть скриптик для GIMP, но его нужно подшаманивать под каждый конкретный случай.
Киньте парочку грязных страниц, я посмотою.
|
|
OlegZ
Стаж: 16 лет 10 месяцев Сообщений: 788
|
OlegZ ·
24-Ноя-16 22:27
(спустя 34 мин., ред. 24-Ноя-16 22:39)
https://yadi.sk/i/PvZSvLtIzQMRR , https://yadi.sk/i/u23t2gAjzQLUB . Скриптом можете поделиться?
P.S. Этот алгоритм для автоматизации не подходит.
|
|
Loexa
 Стаж: 15 лет 5 месяцев Сообщений: 561
|
Loexa ·
25-Ноя-16 00:22
(спустя 1 час 54 мин., ред. 25-Ноя-16 21:50)
Цитата:
Скриптом можете поделиться?
https://cloud.mail.ru/public/7PAu/j4HsJXg8L
Выйти из GIMP, найти папку "plugins", положить туда скрипт. При повторном открытии он появится в пункте меню "Shortcuts".
Если ещё не имеете GIMP, то лучше поставьте GIMP Portable — у него все файлы лежат вместе, а не разбросаны по системе, будет удобнее в "потрохах" ковыряться. И ещё поставьте плагин BIMP для пакетной обработки.
Цитата:
Этот алгоритм для автоматизации не подходит
Подходит, с некоторой модификацией.
Для лучшего качества можно прогнать сначала через фильтр "Selective Gaussian Blur" (радиус 3, порог порядка 100) — он размоет мелкую мельтешню.
Стр.0004 и подобные придётся обработать вручную.
Тонкие красные линии внизу страницы удаляются вместе с мусором. Тоже придётся вручную восстанавливать. Если они на всех страницах, то можно автоматизировать восстановление.
Ну и, конечно, новые файлы сохранять в новую папку, а не затирать ими старые. Чтобы всегда можно было откатиться.
|
|
OlegZ
Стаж: 16 лет 10 месяцев Сообщений: 788
|
OlegZ ·
25-Ноя-16 15:40
(спустя 15 часов, ред. 27-Ноя-16 13:27)
Ну что же, "первый блин" готов. Не прошло и 20 дней  . Как только добавлю оглавление, создам раздачу. Размер в djvu 1002 страничной книги со 125-ю изображениями получился 37 МБ (без оглавления). Всем, кто старался помочь, поклон.
P.S. Хочется добавить в раздачу эту же книгу в pdf. Как только разберусь с clear scan в акробате и отредактирую ошибки распознавания, Бог благословит, выложу эту книгу.
|
|
_Sokrat87_
  Стаж: 16 лет 5 месяцев Сообщений: 4396
|
_Sokrat87_ ·
17-Дек-16 16:04
(спустя 22 дня)
DjVu-Master
Ссылка наверно стоит заменить в инструкции по оглавлению на новую https://sourceforge.net/projects/handyoutlinerfo/
|
|
DjVu-Master
 Стаж: 15 лет 4 месяца Сообщений: 6135
|
DjVu-Master ·
31-Дек-16 13:06
(спустя 13 дней, ред. 31-Дек-16 13:06)
Заменил.
З.Ы. Если нужен код / [code] 1-го и 2-го сообщений этой темы для того о чем вы мне писали в ЛС - то могу скинуть. В общем пишите в ЛС.  Всех с наступающим НГ!!!!!
|
|
_Sokrat87_
  Стаж: 16 лет 5 месяцев Сообщений: 4396
|
_Sokrat87_ ·
31-Дек-16 17:52
(спустя 4 часа)
DjVu-Master писал(а):
72138193Заменил
Спасибо.
Цитата:
З.Ы. Если нужен код / [code] 1-го и 2-го сообщений этой темы для того о чем вы мне писали в ЛС - то могу скинуть. В общем пишите в ЛС.
У модераторов кнопочка специальная есть
|
|
qzerss
Стаж: 12 лет 11 месяцев Сообщений: 254
|
qzerss ·
26-Янв-17 01:56
(спустя 25 дней)
Подскажите, как и чем можно перевести книгу с формата pdf в формат djvu - желательно без потерь.
Может есть какая программка - а я и не знаю...
Или все таки нужно прогонять через Скантейлор?
|
|
папаВлад
  Стаж: 14 лет 4 месяца Сообщений: 2650
|
папаВлад ·
26-Янв-17 06:36
(спустя 4 часа)
qzerss
Тоже недавно озадачился, потестировал, оказалось фигня эти программы по автоконвертации, правильнее разобрать пдф на тифы и потом в дежавю собрать с нужными настройками кодирования в каком-нибудь Djvu Small Mod.
СканТэйлор не понадобится.
--
Я так думаю, чтоб Вам не изучать премудрости дежавю, можно для Skaramusch отправить просто пдф или обработанные тифы, он-то точно знает, как с ними поступить.
|
|
slava_kry
Стаж: 18 лет Сообщений: 245
|
slava_kry ·
26-Янв-17 07:53
(спустя 1 час 17 мин.)
qzerss
Насколько помню, если ПДФ сделан правильно (картинки выделены, текст отдельно), то его можно открыть в СК и всё будет правильно распознано.
Если же ПДФ это простое сборище картинок, то лучше пересобрать.
|
|
qzerss
Стаж: 12 лет 11 месяцев Сообщений: 254
|
qzerss ·
26-Янв-17 11:49
(спустя 3 часа, ред. 26-Янв-17 11:49)
папаВлад писал(а):
72344385с нужными настройками кодирования в каком-нибудь Djvu Small Mod.
А вы случайно не тестировали.
Может подскажете настройки?
Я к примеру думаю, по вашему предыдущему совету - Экстремальные - малоцветное кодирование
Где-то экспериментировал в Экстремальном с разными параметрами - забыл сохранить результат, не совсем правильно Small Mod кодировал - наложение (которое делал в фотошопе) почему-то не прошло правильно после кодирования- было смещение на пару миллиметров - соответственно часть букв была черной.
Я тоже давно искал программку - и опять возникла необходимость - так и ничего из программ не нашел.
|
|
папаВлад
  Стаж: 14 лет 4 месяца Сообщений: 2650
|
папаВлад ·
26-Янв-17 16:30
(спустя 4 часа)
qzerss писал(а):
72345674А вы случайно не тестировали.
Да вот им теперь и делаю дежавю.
qzerss писал(а):
72345674Может подскажете настройки?
Э, нет, там нужно под разные моменты разные настройки, самое простое ч/б текст, под него почти все пункты подходят, остальное тестируйте, ли бо подправляйте в глубине программы под себя, например я для журнала Огонёк подкрутил и сохранил, теперь все эти журналы кодируются с одной настройкой, хотя это не совсем правильно, зато быстро и не нужно под каждую страницу что-то менять.
Погодите чуток, сейчас настоящие дежавьюрщики подойдут, вот тогда будут разъяснения более полезные.
Вы бы написали или показали, что собираетесь сжимать, для дальнейших советов.
|
|
qzerss
Стаж: 12 лет 11 месяцев Сообщений: 254
|
qzerss ·
26-Янв-17 17:07
(спустя 37 мин.)
Да просто книгу перегнать из pdf в формат djvu.
Минимум в ней будет Обложка и задник - цветные .
Максимум - попадутся ещё картинки по книге.
Это будет применяться ко многим книгам - хотят просто иметь книги в djvu.
Вот я и думаю - как этот Small Mod будет кодировать это все дело.
Наверное если его настроить на Экстремальные - Рукопись - он сможет закодировать все без сильных потерь - чтоб картинки отдельно не кодировать - ведь тогда уж проще прогонять в СТ.
Я думаю цветной текст в книгах будет редко встречаться - в основном ведь хочется чтоб картинки не очень пострадали.
Вот и хочу выбрать что-то более менее среднее к общей прогонке.
Жаль нет такой программы как DjVuToy - вот она прекрасно справляется из djvu в pdf ...
А мне бы обратно...
|
|
aawaaw
Стаж: 15 лет 10 месяцев Сообщений: 560
|
aawaaw ·
26-Янв-17 17:36
(спустя 28 мин.)
qzerss
Цитата:
Это будет применяться ко многим книгам - хотят просто иметь книги в djvu.
О боже... опять пакетная обработка. "Как бы так вывернуться, чтоб и рыбку съесть, на ..й не сесть". Анекдот такой был.
Это пакетом - качественно - НЕ работает. Принципиально. Форматы разные по устройству. Индивидуально - хоть СК, хоть DSM, по мне так без разницы. Если пакетно - то вряд ли вы вообще услышите лучший совет, кроме как найти веб-конвертилки. Дёшево и сердито.
|
|
папаВлад
  Стаж: 14 лет 4 месяца Сообщений: 2650
|
папаВлад ·
26-Янв-17 19:30
(спустя 1 час 53 мин.)
qzerss
Обложки по DPI одинаковы с текстовым блоком? Просто обычно обложки и полностраничные иллюстрации оставляют на 300, а текст на 600 DPI. Я бы скинул Вам свой профиль от Огонька, он на сохранение иллюстраций заточен (но не в фото, будут чуть заметные погрешности), а текст - он и в Африке останется текстом, но если есть разница по DPI, то я не знаю какой результат получится на страницах в 300 DPI.
В общем, пробуйте https://yadi.sk/d/x7Rp6nxa3B5Lau профиль Ogonek 600. По уму бы то, что на 300, то и кодировать на 300, а потом клеить с текстовым блоком, но Djvu Small Mod не умеет клеить дежавю, пользуюсь старинным Document Express Editor 6.0.1.1320 Rus (portable).
Всё что знаю написал, если ничего непонятно, попробуйте кромсатор, про него ничего не знаю, но ребята подскажут.
|
|
rioter11
  Стаж: 17 лет 9 месяцев Сообщений: 1644
|
rioter11 ·
26-Янв-17 22:50
(спустя 3 часа, ред. 26-Янв-17 22:50)
я использую Pdf 2 Djvu Converter,
подхватывает и букмарки и текстовый слой который у меня от Clearscan-а
видеоруководство на YouTube
|
|
qzerss
Стаж: 12 лет 11 месяцев Сообщений: 254
|
qzerss ·
27-Янв-17 00:00
(спустя 1 час 9 мин., ред. 27-Янв-17 00:00)
slava_kry
aawaaw
папаВлад
rioter11
Спасибо.
Буду пробовать.
Мне ещё советовали собирать тифы в DjVu Solo.
rioter11 писал(а):
72349590и текстовый слой который у меня от Clearscan
Вот же интересно - кроме Clearscan - я ничего практичного не нашел для вставки распознанного слоя (пару программ тестировал).
И чтоб перенести этот слой без потери в djvu - есть конвертер, а вот чтоб из djvu в pdf перенести качественно вшитый слой - нету. Качественно переводит только скан, и букмарки подхватывает - но не слой (это я говорю о DjVuToy) .
|
|
aawaaw
Стаж: 15 лет 10 месяцев Сообщений: 560
|
aawaaw ·
27-Янв-17 04:58
(спустя 4 часа)
qzerss
Цитата:
собирать тифы в DjVu Solo
Если photo-профилем.
|
|
папаВлад
  Стаж: 14 лет 4 месяца Сообщений: 2650
|
папаВлад ·
27-Янв-17 11:59
(спустя 7 часов)
qzerss
Какая-то сложная у Вас схема, как Вы книги собираете?
Сканы в дежавю через DjVuToy, потом им же конвертируете в пдф, потом чем-то, например акробатовским клеарсканом наложили текст и потом нужно обратно в дежавю и чтоб с текстом. Так чтоль?
А не проще будет просто подложить текст на дежавю. Из ФайнРидера будет качественней акробата.
|
|
qzerss
Стаж: 12 лет 11 месяцев Сообщений: 254
|
qzerss ·
27-Янв-17 15:41
(спустя 3 часа)
папаВлад
не-е-е...
Я просто удивлялся - как для одного формата - есть выход из положения а для другого нету.
К примеру - качественно вшить текст в DjVu - без разницы какого качества скан - есть - fr11DTLcrutch
А вот в pdf - только при качественном скане хорошо получается у Clearscan а в других программах постоянные артефакты.
И чтоб перевести из DjVu в pdf - тоже есть DjVuToy - а вот обратно, нету.(или почти нету - надо поэкспериментировать с Pdf 2 Djvu Converter)
У меня сборка такая как описано в этом FAQ-е по сборке.
Я вообще-то в последнее время со слоем вообще не заморачиваюсь - только если просят.
|
|
папаВлад
  Стаж: 14 лет 4 месяца Сообщений: 2650
|
папаВлад ·
27-Янв-17 17:23
(спустя 1 час 41 мин.)
qzerss писал(а):
72353526Я просто удивлялся - как для одного формата - есть выход из положения а для другого нету.
Все выходы есть, надо искать, пусть и длинный лабиринт, так оцифровка книг - это как квест.
qzerss писал(а):
72353526К примеру - качественно вшить текст в DjVu - без разницы какого качества скан - есть - fr11DTLcrutch
Чтоб перенести текст из пдф в пдф есть связка ФайнРидера и callas pdfToolbox 5, сам пользуюсь, могу видео записать, как раз сейчас делаю. ( записал, полное описание процесса там)
qzerss писал(а):
72353526А вот в pdf - только при качественном скане хорошо получается у Clearscan а в других программах постоянные артефакты.
Плохо понял о чём речь. Ч/б или скан-картинки? Если жмёте не бинаризованные файлы, то конечно получаете артефакты при сжатии jpeg, а если уже бинаризованы, то артефактов не будет. Хотя есть исключение - картинка с текстом, но и тут можно выкрутиться, например заморочится с Файнридером и использовать его MRC-сжатие, правда оно может и на картинку залезть, как повезёт. И PDF Transformer+ умеет MRC наложить, но это на вкус и цвет, я редко использую.
Для примера, на этой книге вообще не делал бинаризацию, проще было в ФР с MRC собрать, а то в СТ либо жирный текст слипался, либо тонкий исчезал, а так всё сохранилось как в книге.
qzerss писал(а):
72353526И чтоб перевести из DjVu в pdf - тоже есть DjVuToy - а вот обратно, нету.(или почти нету - надо поэкспериментировать с Pdf 2 Djvu Converter)
Пробуйте, видите и rioter11 пользуется, мне эта прога не подошла для журнала Огонёк, может с текстом будет легче справиться. qzerss, будут примеры, порешаем. Сколько оцифровщиков, столько и выходов найдёте
|
|
_Sokrat87_
  Стаж: 16 лет 5 месяцев Сообщений: 4396
|
_Sokrat87_ ·
27-Янв-17 17:53
(спустя 30 мин.)
Господа, может поколдуете, когда раздача появится?
https://rutr.life/forum/viewtopic.php?t=5093876
Почти гиг..
|
|
папаВлад
  Стаж: 14 лет 4 месяца Сообщений: 2650
|
папаВлад ·
27-Янв-17 22:15
(спустя 4 часа)
_Sokrat87_
Обратите внимание на этот скриншот, там возни с восстановлением утраченного текста немерено будет.
Есть ещё файл, правда тоже не ахти, где-то на 150 DPI, но хоть все буквы на месте.
Перезалил на временную ссылку, когда-нибудь удалю.
Источник
Я бы оставил ту раздачу без изменений, там действительно картинки будут лучше, а Вы решайте на своё усмотрение.
|
|
_Sokrat87_
  Стаж: 16 лет 5 месяцев Сообщений: 4396
|
_Sokrat87_ ·
27-Янв-17 23:07
(спустя 52 мин.)
|
|
qzerss
Стаж: 12 лет 11 месяцев Сообщений: 254
|
qzerss ·
03-Фев-17 16:14
(спустя 6 дней)
OlegZ писал(а):
71892106Кто-нибудь подскажет как вот это
убрать в фотошопе или любом другом редакторе в автоматическом режиме (для всех сканов)?
Хотел бы поднять этот вопрос повторно.
Списывался с OlegZ - он этот метод не применял.
Как-то не могу найти решение.
Читал о скрипте
Loexa писал(а):
71892817Выйти из GIMP, найти папку "plugins", положить туда скрипт. При повторном открытии он появится в пункте меню "Shortcuts".
Если ещё не имеете GIMP, то лучше поставьте GIMP Portable — у него все файлы лежат вместе, а не разбросаны по системе, будет удобнее в "потрохах" ковыряться. И ещё поставьте плагин BIMP для пакетной обработки.
Что-то не получается его увидеть в программе - помогите разобраться (у меня GIMP Portable стоит)
А вот что обрабатывал - и что получилось
Вот исходники - http://www.fayloobmennik.net/6841424
Если есть другой выход из положения - буду очень признателен (с учетом что нужна пакетная обработка)
|
|
Loexa
 Стаж: 15 лет 5 месяцев Сообщений: 561
|
Loexa ·
03-Фев-17 18:23
(спустя 2 часа 8 мин., ред. 03-Фев-17 18:23)
Цитата:
Что-то не получается его увидеть в программе - помогите разобраться (у меня GIMP Portable стоит)
File -> Batch Image Manipulation.
Скрипт нужно под каждый конкретный случай рисовать.
|
|
qzerss
Стаж: 12 лет 11 месяцев Сообщений: 254
|
qzerss ·
03-Фев-17 20:05
(спустя 1 час 41 мин.)
Loexa писал(а):
72405870Скрипт нужно под каждый конкретный случай рисовать.
В моем случае подойдет?
Я кидаю скрипт и плагин по пути GIMPPortable\Data\gegl-0.2\plug-ins
И в File -> ничего не вижу
Может есть какой другой способ убрать цветной мусор?
|
|
Loexa
 Стаж: 15 лет 5 месяцев Сообщений: 561
|
Loexa ·
03-Фев-17 20:21
(спустя 16 мин.)
Цитата:
Я кидаю скрипт и плагин по пути GIMPPortable\Data\gegl-0.2\plug-ins
Точно не туда. Где-то тут: Program Files/GIMPPortable/App/gimp/lib/gimp/2.0/plug-ins
Цитата:
Может есть какой другой способ убрать цветной мусор?
Я не понял, мусор цветной или ч-б?
|
|
qzerss
Стаж: 12 лет 11 месяцев Сообщений: 254
|
qzerss ·
03-Фев-17 20:45
(спустя 23 мин.)
Loexa писал(а):
72406737Я не понял, мусор цветной или ч-б?
Тут и ч\б и цветной мусор.
|
|
|