FAQ по сборке (созданию) DjVu книги из сырых сканов

Страницы :   Пред.  1, 2, 3 ... 40, 41, 42
Ответить
 

<Ra>

Стаж: 16 лет 6 месяцев

Сообщений: 166

<Ra> · 17-Июл-25 01:25 (2 месяца 13 дней назад)

Здравствуйте.
Есть книга, в которой огромное количество разукрашенного текста в разные цвета. Книгу нужно просматривать не только в электронном виде, но и напечатать будет необходимо. В СТ я все сделал, там или ч-б, или цвет. Если ч-б, часть некоторых цветных символов пропадает (например, часто пропадает в "С" кончики, в "А" перемычка и прочее). Изначально я хотел сделать ч-б, разукрасить текст (у меня был большой перерыв в сканировании и оказалось я забыл как разукрашивать текст, когда djvu делаешь...), но какую насыщенность в СТ я бы не выставлял, все равно часть текста плохо читаема.
Делал в цвете, но тогда много заднего фона (с другой страницы) и паразитного фона.
И для меня важно сохранить исходные цвета, поскольку там часто выделяются важные моменты в тексте, а в нотах отдельно это помогает. Ведь книга рассчитана на детей и новичков.
Подскажите что делать и как быть, пожалуйста. Я уже забыл((
Вот пример одной страницы - https://drive.google.com/file/d/1yoHBoxRmX0owE2wqVAZco-lC0AhelZfM/view?usp=sharing
Если что, могу прислать всю книгу и СТ проект.
[Профиль]  [ЛС] 

SI{AY

Стаж: 17 лет 6 месяцев

Сообщений: 1406

SI{AY · 17-Июл-25 07:44 (спустя 6 часов)

<Ra>
хоть в последних версиях ST и есть сегментатор, который может попытаться к отдельные цвета это всё вытянуть,но результат так себе. В основном это ручная работе через SK, где руками надо будет разметить все участки текста отличного цвета и проставить им соответствующее значение.
конкретно про зоны
https://www.youtube.com/watch?v=zSDnkloduk0
полный цикл
https://www.youtube.com/watch?v=BQXBbtIx43M&t=209s
[Профиль]  [ЛС] 

aawaaw

Стаж: 16 лет 2 месяца

Сообщений: 591


aawaaw · 17-Июл-25 08:37 (спустя 53 мин.)

более простой ролик по сканкромсатору
https://wdfiles.ru/1u8yf
копия https://disk.yandex.ru/i/2NxrOJfvRbsJ_A
[Профиль]  [ЛС] 

SI{AY

Стаж: 17 лет 6 месяцев

Сообщений: 1406

SI{AY · 17-Июл-25 12:29 (спустя 3 часа, ред. 17-Июл-25 12:29)

aawaaw
вроде эдит берет настройки всегда с последней зоны, поэтмоу через альт разметили на группы, а потом надо по группа в любом случае скопировать нужные настройки.
[Профиль]  [ЛС] 

<Ra>

Стаж: 16 лет 6 месяцев

Сообщений: 166

<Ra> · 20-Июл-25 23:06 (спустя 3 дня)

Спасибо! Придется осваивать Кромсатор. Мне он тяжелым показался еще давно и я не освоил его.
aawaaw, спасибо за простое объяснение, там вся книга построена по данному принципу, поэтому надеюсь, что мне этого хватит пока что. Правильно ли я понимаю, что в случае создания пдф (мне придется его создать тоже) страницы с цветным текстом будут сохраняться цветным jpg? А соответственно размер будет увеличен. А djvu соответственно просто окрасит цветной текст. Или я неправильно понимаю процедуру создания пдф и djvu с цветным текстом? Не хотелось бы испоганить книжки подобного рода плохой конвертацией (трачу кучу времени на сканирование в 600дпи в цвете, а на выходе пережму).
SI{AY, спасибо за развернутое видео. Буду потихоньку изучать его. Скажите, о каких последних версиях СТ идет речь? Я уже 10 лет делаю ноты в нем, зашел сейчас на сайт СТ орг и там версия от 12 года. Где можно найти модификации и другие версии? Я эту программу советую своим студентам из-за простоты интерфейса, и если там что-то улучшено или добавлено, хотелось бы знать это.
[Профиль]  [ЛС] 

aawaaw

Стаж: 16 лет 2 месяца

Сообщений: 591


aawaaw · 21-Июл-25 04:50 (спустя 5 часов, ред. 21-Июл-25 04:50)

<Ra> писал(а):
88012012страницы с цветным текстом будут сохраняться цветным jpg
нет.
если вы сделаете зоны, как я показал на видео, и сделаете пдф средствами кромсатора (для этого надо в выходном задании нажать кнопку Process, перед этим проверив что выходной формат файла pdf и что его имя непустое) - то пдф получится приемлемый, растровыми крашеными картинками. Возможно, нужно будет отстроить метод компрессии зон с jpeg на flate. Это или в самом задании, или в Options. Я деталей не знаю/не помню, потому что перегоняю из дежавю в пдф с помощью djvutoy версии новее 3.05. Там вообще идентично получается.
Вот вам пример результатов: djvu, pdf SK (aa), pdf конверсией через djvutoy. https://disk.yandex.ru/d/1OLyfr4GDRDLzA https://wdho.ru/7Tey
Кромсатор вообще не предназначен для порчи книг, но им надо уметь пользоваться. Сейчас куча доки на него подготовлена.
Форки ST на руборде описаны.
[Профиль]  [ЛС] 

23Wera23

Стаж: 4 года 7 месяцев

Сообщений: 46


23Wera23 · 12-Авг-25 22:24 (спустя 22 дня)

Здравствуйте.
Сильно не пинайте, но нужна ваша помощь. А именно ваша оценка работы ( я про обработчиков книг)
Есть знакомый человек, делает книги . Мнение одного человека не считает ценным для оценки его деятельности. Вот и прошу высказаться о качестве его работы (он постеснялся сам тут отписаться).
Он работает со сканами в 300 dpi формата jpeg (если ему дают 600 dpi - переводит в 300) говорит что этого хватает. Дают сканы в tiff - переводит в jpeg. Обработку проводит в основном в ABBYY FineReader. И говорит что книги смотрят на разных устройствах (телефоны, планшеты) и при таком небольшом размере - качество хорошее.
Вот в принципе сама работа - https://wdho.ru/c6iE
Очень буду благодарен за отзывы.
Может со стороны он более лучше поймет.
Спасибо всем.
[Профиль]  [ЛС] 

aawaaw

Стаж: 16 лет 2 месяца

Сообщений: 591


aawaaw · 13-Авг-25 04:45 (спустя 6 часов)

23Wera23 писал(а):
88090030Может со стороны он более лучше поймет.
Что поймёт?
скрытый текст
Формально 300дпи для глаза "достаточно". Для иллюстраций.
Текст-то векторный. Все мелкие объекты на рисунках обозначены. Вид у иллюстраций неприятный, контраст задран и мутновато. Я бы такую книгу детям не показывал.
Но что-либо осмысленное можно сказать, только поставив рядом перед собой бумажный оригинал и распечатку из пдф. Может там и оригинал неприятный.
Могу ещё добавить, что рассмотрел в масштабе 500% грифона и орнамент со второй страницы. Куча артефактов сжатия на красном фоне, а орнамент видимо уничтожен. Там вместо центральной розетки в косую клетку - полупятна-полусетка. Думал, что мне это напоминает, вспомнил: советские детские книги 80х годов, на 12-16 листков. Для самых маленьких. Когда в типографии расслоение цветов, их гамма и выбранная линиатура такие, что рисунки убиты. С одной стороны, детям пофиг. Они большие красочные пятна воспринимают поначалу. Но есть подводный камень: мозг же обучается на новом материале, и формирует паттерны. Что хорошо что плохо. Вот с помощью криворуких рисунков и формируются паттерны "тяп-ляп и так сойдёт". Когда взрослого уже человека станут на работе ругать за некрасивость его изделия или даже не примут художественную работу, он искренне не поймёт, что не так. Потому что паттерн был заложен в два-три года. Ему в два года именно так понравилось. Потому что любимая мама читала. И это называется "отсутствие художественного вкуса". Взрослый может это поправить только сам и только исследуя высококачественные предметы. "Насматривая", говорят. Спорить и доказывать ему что он неправ - бесполезно, будет контрреакция "а мне так нравится!" (или самооправдание "при таком небольшом размере...", суть та же самая). Глубокая тема на самом деле.
[Профиль]  [ЛС] 

SI{AY

Стаж: 17 лет 6 месяцев

Сообщений: 1406

SI{AY · 13-Авг-25 08:01 (спустя 3 часа, ред. 13-Авг-25 08:01)

23Wera23
много для чего 300 достаточно. Jpeg крайне спорно (имхо только бы без сжатия если, а лучше не jpeg). Как и обработка только в FineReader.
Но всё зависит от того какой исходник, какие шрифты, чего хочется иметь в результате и сколько потратить времени. Недавно было обсуждение примерно тут https://rutr.life/forum/viewtopic.php?p=88024033#88024033
не очень понятно зачем критиковать, человек же не сам пришёл спрашивать "что можно лучше". Если Вам не нравится результат его работы - делайте сами раз сканы Ваши
По факту придраться есть всегда к чему, каждый для себя выбирает насколько много он готов тратить время на что то, и какой результат его лично устроит, и с этим ничего не сделаешь. За счастье бывает найти даже фотки книги.
скрытый текст
ну и критики раз хотелось хДД
23Wera23 писал(а):
88090030более лучше
"лучше" - уже является превосходной степенью, с "более" не употребляется))
[Профиль]  [ЛС] 

slava_kry

Стаж: 18 лет 5 месяцев

Сообщений: 257


slava_kry · 13-Авг-25 15:34 (спустя 7 часов, ред. 13-Авг-25 15:34)

23Wera23
Сканы "прожарены", т.е. акварельные рисунки (возможно я не прав, но манера полутоновых перетеканий говорит об акварели) превращены в высококонтрастные иллюстрации и насильно выбеленный задник.
Качество картинок превращено "в фарш" из-за разрешения и сжатия.
Всё это производит удручающее впечатление.
Если можно увидеть оригинал с рисунком на весь лист - было бы неплохо. Допустим страницы 83, 73, 43.
...Акварельные и карандашные рисунки самое сложное, что может попасться на обработку.
У меня лежит так и не обработанные книжка сказок Андерсена в рисунках Г.А.В. Траугот от aawaaw, т.к. я так и не смог подобрать удовлетворительный алгоритм.
[Профиль]  [ЛС] 

23Wera23

Стаж: 4 года 7 месяцев

Сообщений: 46


23Wera23 · 13-Авг-25 20:08 (спустя 4 часа, ред. 13-Авг-25 20:08)

slava_kry писал(а):
88091985можно увидеть оригинал
Да, пожалуйста - https://wdho.ru/7Udk
[Профиль]  [ЛС] 

Gh@nz

Стаж: 18 лет 9 месяцев

Сообщений: 3376


Gh@nz · 13-Авг-25 22:44 (спустя 2 часа 35 мин.)

23Wera23
Картинки не надо трогать.
[Профиль]  [ЛС] 

SI{AY

Стаж: 17 лет 6 месяцев

Сообщений: 1406

SI{AY · 13-Авг-25 23:10 (спустя 26 мин.)

23Wera23 писал(а):
88092998Да, пожалуйста
но оно же уже пожатый жепег
[Профиль]  [ЛС] 

23Wera23

Стаж: 4 года 7 месяцев

Сообщений: 46


23Wera23 · 14-Авг-25 00:35 (спустя 1 час 24 мин.)

SI{AY писал(а):
88093624но оно же уже пожатый жепег
Это от сканировшика. Как там и что там я, не знаю.
Из этого и делалась книга.
Я понимаю что изначально нужно качество, но он сказал сканировщику 300 в джипег - сойдет, вот он так и сделал ему.
aawaaw писал(а):
88090624формируются паттерны "тяп-ляп и так сойдёт"
Спасибо за этот аспект.
SI{AY писал(а):
88090805зачем критиковать
Я не считаю это критикой а мнение со стороны, людей которые в теме.
SI{AY писал(а):
88090805делайте сами раз сканы Ваши
Да в том то и дело, к нему обращаются сканировщики (не профи) говорят - есть книга, могу отсканировать, нужно? Вот он дает им параметры и на выводе вот такое "чудо". Я ведь не контролирую его жизнь и переписку, чтоб была возможность повторно связаться со сканировщиками.
Я ж писал:
23Wera23 писал(а):
88090030Мнение одного человека не считает ценным для оценки его деятельности
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 9 месяцев

Сообщений: 2671

папаВлад · 14-Авг-25 03:09 (спустя 2 часа 33 мин.)

23Wera23
Если результат устраивает обработчика, то тут ничего не поделаешь, это хобби и оно должно приносить удовольствие.
Другое дело, если кого-то что-то не устраивает, тогда об этом можно намекнуть, а ещё лучше сразу дать совет как эту неприятность можно исправить, возможно обработчик воспользуется советом и ему такой вариант понравится, а возможно проигнорирует, это его право.
Опять же, можно попросить делать два варианта, такое среди обработчиков тоже практикуется.
Ещё у него можно попросить обработанные по его методике файлы, но без сборки в пдф, сожмёте самостоятельно по своему вкусу, это если обработка устраивает. Обычно обработчики некоторое время сохраняют проекты или постраничные файлы на случай обнаружения косяков читателями.
Хочу обратить внимание обработчика на некоторые моменты в файле Дружинина.pdf, надеюсь заинтересовать.
Для начала - о хорошем. Посмотрев на оригинальные сканы, могу отметить, что обработкой ничего не испорчено, слегка отбелен фон и сделана обрезка полей. Когда будут другие сканы, тогда будет новое обсуждение, если оно вообще будет.
А далее неприятные моменты, которые можно избежать...
1. Задняя обложка не на своём месте. И я знаю почему, потому что обработчик не умеет переключать вид просмотра в своём ридере (читалке/листалке), хотя все ридеры умеют показывать отдельно первую страницу в режиме по 2 страницы, но он об этом не знает, потому в сети появляются такие неправильные копии книг.
Как исправить - в любом pdf-редакторе перетянуть заднюю обложку с позиции 2 в самый конец.
И обязательно уточнить для себя на любом форуме как изменить вид просмотра у конкретного ридера, обязательно пригодится, потому что правильные файлы соответствуют расположению страниц в книге.
2. Почти все страницы имеют разрешение 150 dpi, кроме 83 и 90.
150 dpi - это низкое качество, соответственно обработчик делает файлы низкого качества и значит эти файлы требуют переделки.
Как исправить - изменить методику обработки или сжатия.
Варианты:
- отказаться от технологии Clearscan, которую запускаете в Acrobat, файлы на выходе однозначно будут крупнее, но оно того стоит.
- если Clearscan точно должен быть, тогда в Acrobat нужно загружать готовый pdf на 600 dpi, а если в Acrobat собираете pdf из jpg или tif, то предварительно повысить разрешение этих файлов до 600 dpi. Объясню зачем, при обработке технологией Clearscan разрешение занижается в 2 раза, было 300 - будет 150, было 600 - станет 300. И ещё, поставьте в настройках сжатия Clearscan значение 600 dpi. И тут файлы будут крупнее, потому что качество иллюстраций будет выше, и, кстати, обработка текста в вектор будет точнее, буквы приятнее.
3. Страницы 83 и 90 имеют разрешение 300 dpi и качество jpeg 100%, и это грубая ошибка, сжатие должно быть обязательно. В сумме эти 2 страницы занимают более 4 МБ (1,88 + 2,17).
Как исправить - в любом pdf-редакторе сжать конкретные страницы по вкусу. Хотя, есть нюансы, возможно редактор не умеет сжимать отдельные страницы, тогда их выдернуть, сжать и вернуть на своё место, и не забыть удалить несжатые. Или вот ещё оказия, тот же Acrobat не умеет повторно пережимать jpeg и jpeg2000, при этом он может из одного сжатия в другое, хотя такой манёвр обычно никому не нужен, так как обработчики как правило приверженцы какого-либо одного сжатия. Если есть только Acrobat, то и им можно за 2 прохода, сначала пережать в zip, а потом ещё раз в jpeg с нужным качеством.
Почему именно эти 2 страницы получились косячные - возможно добавили эти страницы позже и не обратили внимание на наличие или отсутствие сжатия, и ещё такое случается после некоторых исправлений конкретных иллюстраций в уже готовом файле, если что-то исправили, то перепроверяйте.
Как узнать про косяки отдельных страниц - например в Acrobat извлечь страницы как отдельные файлы, далее смотреть на размеры страниц, особенно в которых была какая-либо коррекция, например удаление обрезанного содержимого, вот именно это действие точно не стоит делать.
[Профиль]  [ЛС] 

aawaaw

Стаж: 16 лет 2 месяца

Сообщений: 591


aawaaw · 14-Авг-25 04:33 (спустя 1 час 24 мин.)

папаВлад писал(а):
88093997Почти все страницы имеют разрешение 150 dpi
нет внутри пдф понятия "разрешение".
Лично у меня кусок с грифоном pdf xchange editor 10 plus извлек с dpi 96. А в инструменте пережатия показывает 150. Это рассчитанное значение.
[Профиль]  [ЛС] 

slava_kry

Стаж: 18 лет 5 месяцев

Сообщений: 257


slava_kry · 14-Авг-25 05:47 (спустя 1 час 13 мин.)

23Wera23
Ну это какой-то "аллес капут!" со всех сторон.
В таком ключе о качестве в принципе говорить не приходиться.
https://disk.yandex.ru/i/oMkqNZZj7hNYDg - вот пример для осознания из того самого Андерсена. И фон нужно убрать чтобы нежные разводы акварели остались на месте.
Также в акварели нет места чёрному, там везде тёмносерое. Как пример https://disk.yandex.ru/d/rqRlf6iSK_JF5g
Вот я сделал https://disk.yandex.ru/i/0oPU9ndoPNEvkw - но мне не нравится полученное.
А по новой подходить, пока нет энтузиазма.
[Профиль]  [ЛС] 

SI{AY

Стаж: 17 лет 6 месяцев

Сообщений: 1406

SI{AY · 14-Авг-25 08:02 (спустя 2 часа 14 мин.)

23Wera23 писал(а):
88093826300 в джипе
300 жепег тоже бывает разное. у данного качество установлено на 75% при сохранении. Еслиб было 100 то была бы ситуация получше. Ну и ничто не мешает изначально сканировать нормально, а отдавать то что просят.
П.С.: там кстати 44 страница не обработанная осталась
[Профиль]  [ЛС] 

папаВлад

Top Loader 01* 100GB

Стаж: 14 лет 9 месяцев

Сообщений: 2671

папаВлад · 14-Авг-25 14:59 (спустя 6 часов, ред. 14-Авг-25 15:23)

aawaaw писал(а):
88094060Это рассчитанное значение.
Хорошо, пусть так, мне без разницы какую терминологию использовать, главное донести до адресата основной смысл.
Не нравится моё обоснование плохого результата, напишите по-своему.
p.s. Если перевести на деньги, то сразу станет понятно. Обработчику предложили 300 денег, он их положил в банк "Clearscan", потом решил всё забрать обратно, а ему вернули только 150, объяснив тем, что вес в два раза легче. В итоге и банк и обработчик остались довольны.
SI{AY писал(а):
88094272Ну и ничто не мешает изначально сканировать нормально, а отдавать то что просят.
Вот-вот, к сканировщику в данном случае даже больше претензия, чем к обработчику. Помимо сжатых файлов ещё что-то подкручено в настройках сканирования, потому что нет фона бумаги.
Хотя, нам мало известна ситуация, возможно обработчик заказал конкретные настройки сканирования и сохранения.
[Профиль]  [ЛС] 

aawaaw

Стаж: 16 лет 2 месяца

Сообщений: 591


aawaaw · 14-Авг-25 15:32 (спустя 33 мин.)

папаВлад писал(а):
88095401главное донести до адресата основной смысл.
Не нравится моё обоснование плохого результата, напишите по-своему.
Я к тому и веду.
Дело не всегда в низком числе отсчетов по картинке, хотя 150 это, конечно, перебор в 99,99% случаев. Но книжка в 300дпи для текста может быть вполне читаема и приятна. Даже в 200дпи видел пару примеров, вполне ништяк.
Мутность исходно очень детализированной картинки, вот в чем суть. Это как чужие очки нацепить - вроде понимаешь, что мир должен быть четким, а он расплывается, и сфокусироваться нельзя.
Где-то у slava_kry были сканы гравированных картинок из библии в 1200дпи, я даже пару себе когда-то сохранял. Вот там снижение даже до 600 напрочь убивало прелесть рисунка. Штрихи сливались.
А в примере с Дружининой плюсом к малому числу отсчетов добавили еще и джипеговское размытие с артефактами. Непрофессионально это.
[Профиль]  [ЛС] 

23Wera23

Стаж: 4 года 7 месяцев

Сообщений: 46


23Wera23 · 14-Авг-25 20:09 (спустя 4 часа)

Спасибо Огромное Всем.
Надеюсь он прочтет, задумается и сделает правильные выводы.
папаВлад писал(а):
88093997отказаться от технологии Clearscan
Спасибо за совет.
aawaaw писал(а):
88095501Непрофессионально это.
Ваши слова да б ему в уши.
Спасибо за помощь.
[Профиль]  [ЛС] 

SI{AY

Стаж: 17 лет 6 месяцев

Сообщений: 1406

SI{AY · 14-Авг-25 23:36 (спустя 3 часа)

А как тут правильно растр давить? я что то как ни пытался, где-нибудь на краях/углах лезут артефакты https://disk.yandex.ru/d/-6ycJib1XdjIuQ
[Профиль]  [ЛС] 

slava_kry

Стаж: 18 лет 5 месяцев

Сообщений: 257


slava_kry · 15-Авг-25 07:06 (спустя 7 часов)

SI{AY
В Шопе - Smart Blur
Только Quality поставьте High и всё.
Он тут неявный, потому и такого хватит.
[Профиль]  [ЛС] 

SI{AY

Стаж: 17 лет 6 месяцев

Сообщений: 1406

SI{AY · 15-Авг-25 12:47 (спустя 5 часов)

slava_kry
спасибо, кажется тут именно с high я и не попробовал, а потом попытки сверху сюрфейсом блюром обмазаться, и прочим, с разными комбинациями настроек приводили к не оч результату.
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error