FAQ по сборке (созданию) DjVu книги из сырых сканов

Страницы :   Пред.  1, 2, 3, 4 ... 39, 40, 41  След.
Ответить
 

DjVu-Master

Стаж: 14 лет 10 месяцев

Сообщений: 6109

DjVu-Master · 13-Июл-13 13:43 (11 лет 4 месяца назад, ред. 13-Июл-13 20:45)

$Shorox
Записал видео от А до Я. Обалдеете!
Толбко оно 1.2 Гб вышло. Ща подумаю куда залить.
Цитата:
Продолжительность: 4 ч. 19 м.
https://rutr.life/forum/viewtopic.php?t=4486865
[Профиль]  [ЛС] 

Irbys27

Top Seed 05* 640r

Стаж: 14 лет 9 месяцев

Сообщений: 2428

Irbys27 · 08-Авг-13 08:20 (спустя 25 дней)

Можно ли как-нибудь сохранить оригинальный шрифт при распознавании этой страницы?
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 14 лет 10 месяцев

Сообщений: 6109

DjVu-Master · 08-Авг-13 09:10 (спустя 50 мин.)

Arlandok
Надо доп. шрифты подключать. А как - я без понятия. И не факт что получится.
Отсканируйте при 400 дпи и выведите после обработки в 400 либо в 600. И подшейте слой распознанного текста.
[Профиль]  [ЛС] 

Ezrah

Старожил

Стаж: 17 лет

Сообщений: 466

Ezrah · 09-Авг-13 17:39 (спустя 1 день 8 часов)

Процедура в FAQ оказалась чрезмерно усложненной. Я выбрал default для всех страниц, но цветная страница и в итоговом djvu осталась цветной)))
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 14 лет 10 месяцев

Сообщений: 6109

DjVu-Master · 09-Авг-13 17:53 (спустя 13 мин.)

Ezrah писал(а):
60418032Я выбрал default для всех страниц, но цветная страница и в итоговом djvu осталась цветной)))
Возьмите закодируйте одну и ту же цвет. стр. профилем default и photo и сравните качество.
[Профиль]  [ЛС] 

albal74

Стаж: 15 лет 3 месяца

Сообщений: 105

albal74 · 15-Авг-13 10:14 (спустя 5 дней)

DjVu-Master Спасибо огромное!
[Профиль]  [ЛС] 

Irbys27

Top Seed 05* 640r

Стаж: 14 лет 9 месяцев

Сообщений: 2428

Irbys27 · 16-Авг-13 10:21 (спустя 1 день)

Подскажите, как управлять функцией "распрямление строк" в Scan Tailor Futured"? Что-то у меня эта функция не работает.
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 14 лет 10 месяцев

Сообщений: 6109

DjVu-Master · 16-Авг-13 11:19 (спустя 57 мин.)

Arlandok писал(а):
60499392Подскажите, как управлять функцией "распрямление строк" в Scan Tailor Futured"? Что-то у меня эта функция не работает.
Сам в замешательстве.
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 8 месяцев

Сообщений: 1179


Shassukkum · 16-Авг-13 12:32 (спустя 1 час 13 мин.)

Arlandok писал(а):
60499392Подскажите, как управлять функцией "распрямление строк" в Scan Tailor Futured"? Что-то у меня эта функция не работает.
А какой Вы версией пользуетесь?
Переходите сразу на СТФ, советую
скрытый текст
Там есть замечательное "краевое" выравнивание.
[Профиль]  [ЛС] 

Irbys27

Top Seed 05* 640r

Стаж: 14 лет 9 месяцев

Сообщений: 2428

Irbys27 · 18-Авг-13 14:19 (спустя 2 дня 1 час)

Shassukkum
Не помогла замена версий. Вот страница, попробуйте сами
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 8 месяцев

Сообщений: 1179


Shassukkum · 18-Авг-13 15:42 (спустя 1 час 23 мин., ред. 18-Авг-13 15:42)

Arlandok писал(а):
60526968Shassukkum
Не помогла замена версий. Вот страница, попробуйте сами
А и не поможет. Любая версия. Я о краевом выравнивании говорил.
Вот что удалось получить после БукРесторера


Офигеть, почти каждому третьему — FAQ не помог.
Неужели на трекере так много матёрых оцифровщиков книг и журналов?
[Профиль]  [ЛС] 

Loexa

Стаж: 15 лет

Сообщений: 566

Loexa · 18-Авг-13 19:52 (спустя 4 часа, ред. 18-Авг-13 19:52)

Shassukkum писал(а):
60527160Офигеть, почти каждому третьему — FAQ не помог.
А я предупреждал, что мягше надо, мягше... И легше:)
Кстати, у Arlandok точно такие же огрехи между буквами, как и в моём случае. И гарнитура та же - "Обыкновенная новая". Не удивлюсь, если и типография та же самая.
Есть соображения, что делать с межбуквенныи кляксами?
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 8 месяцев

Сообщений: 1179


Shassukkum · 18-Авг-13 20:32 (спустя 39 мин.)

Loexa писал(а):
60530237
Shassukkum писал(а):
60527160Офигеть, почти каждому третьему — FAQ не помог.
А я предупреждал, что мягше надо, мягше... И легше:)
))
Цитата:
Кстати, у Arlandok точно такие же огрехи между буквами, как и в моём случае. И гарнитура та же - "Обыкновенная новая". Не удивлюсь, если и типография та же самая.
Ух-ты, классная тема. К сожалению я не программер и в этих вопросах не бум-бум. Еле с командной строкой управляюсь)
Так что подписываюсь к теме.
Цитата:
Есть соображения, что делать с межбуквенныи кляксами?
А покажите пжлст "сырой" скан. Если таковой, конечно, остался.
[Профиль]  [ЛС] 

Loexa

Стаж: 15 лет

Сообщений: 566

Loexa · 18-Авг-13 20:55 (спустя 23 мин., ред. 18-Авг-13 22:06)

Shassukkum, вот:
Сырой скан:

После ScanTailor:

Про Фотошоп я маленько наврал - не нашёл к нему фильтр Median Cross. Вот после XnView+GIMP:

C фотошоповским Median выходит ещё хуже.
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 8 месяцев

Сообщений: 1179


Shassukkum · 18-Авг-13 21:05 (спустя 10 мин.)

Ясно. Подозреваю, то что Вы сделали, сделать лучше нельзя. Можно ещё пройтись БукРесторером, это там где удаление точек, что-бы мелочь всякую почистить точечную, (напр. в слове — "Это убедительно показывает") а вот "отрезки" ... хм-м ... скажу честно, в подобных случаях я ищу другое издание. Просматриваю книгу на наличие таких и подобных дефектов печати. Уж-если совсем никуда, то оставляю как есть, не вычищать же каждый скан от этих клякс? Так и не один месяц можно угробить на работу.
Так что лучше, пожалуй, и не сделать.
[Профиль]  [ЛС] 

Loexa

Стаж: 15 лет

Сообщений: 566

Loexa · 18-Авг-13 21:19 (спустя 13 мин.)

Shassukkum писал(а):
60532359скажу честно, в подобных случаях я ищу другое издание
Вроде не было других изданий. "На китайской земле", воспоминания советских добровольцев, 2-ое издание, дополненное, 1975 год.
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 8 месяцев

Сообщений: 1179


Shassukkum · 18-Авг-13 21:56 (спустя 37 мин.)

Я-тут поупражнялся немного, на ночь глядючи.
Есть такой замечательный фриварный сборник, под названием mehdiplugins. Там есть плуг → Flat Median 1.4.
Качаете, кидаете в папку к плугам в ФШ.
Вот что у меня получилось, предварительно:
До

После

Поиграйтесь с тремя ползунками, может чего интересного и выйдет (в плане вертикальных клякс, да впрочем и др. вида, тоже). Обратите внимание как я "боролся" с "1 гг. обст".
Завтра ещё на работе его покручу, сегодня устал.
[Профиль]  [ЛС] 

Loexa

Стаж: 15 лет

Сообщений: 566

Loexa · 18-Авг-13 22:35 (спустя 39 мин.)

Shassukkum писал(а):
60533048Есть такой замечательный фриварный сборник, под названием mehdiplugins. Там есть плуг → Flat Median 1.4.
Тоже костыль, конечно, но попробую. А то уже склоняюсь к методу Степаненко - перевёрстке.
Кстати, алгоритм был такой:
первый слой - бинаризованный оригинал, второй слой обработан Median cross, радиус 11, с небольшими разрывами букв.
Выделение белого Color Range.
Уменьшение выделения на 2-3 пиксела.
Удаление слоя.
Удаление всего, вошедшего в выделение.
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 8 месяцев

Сообщений: 1179


Shassukkum · 18-Авг-13 22:50 (спустя 15 мин.)

Loexa писал(а):
60533538
Shassukkum писал(а):
60533048Есть такой замечательный фриварный сборник, под названием mehdiplugins. Там есть плуг → Flat Median 1.4.
Тоже костыль, конечно, но попробую. А то уже склоняюсь к методу Степаненко - перевёрстке.
Если надумаете перевёрстывать, то лучше сразу в векторный PDF.
Опять же так, в плане пожеланий
Цитата:
Кстати, алгоритм был такой:
первый слой - бинаризованный оригинал, второй слой обработан Median cross, радиус 11, с небольшими разрывами букв.
Выделение белого Color Range.
Уменьшение выделения на 2-3 пиксела.
Удаление слоя.
Удаление всего, вошедшего в выделение.
Прикольно, надо опробовать по случаю.
А вообще, если бумага с досками попадается ("рубили вместе с будкой") то я такие сканы прогоняю сначала через ФШ, убираю по цвету доски, (сканы у меня всегда в колоре). т.е максимально избавляюсь от всякого такого лишнего.
Понял на собственной шкуре, лучше почистить максимально возможно сканы чем потом ручками в СТ корячиться, обводить кляксы. Теперь вот и плуг подвернулся.
("как я его сразу для этих целей не определил??")
[Профиль]  [ЛС] 

Loexa

Стаж: 15 лет

Сообщений: 566

Loexa · 18-Авг-13 23:14 (спустя 23 мин., ред. 18-Авг-13 23:14)

Shassukkum писал(а):
60533743Если надумаете перевёрстывать, то лучше сразу в векторный PDF.
Согласен.
Цитата:
А вообще, если бумага с досками попадается
Тоже согласен.
Но там явно шрифт убитый. Или литеры изношены, или их так изначально криво отлили. Огрехи в одних и тех же местах.
Насколько знаю, до конца 20го века готовые литеры набирали в пазы на наборной доске. Потом заливали свинцом и получали матрицу для печати.
А вот этот набор был или кривой, или изношен, и свинец затёк в промежутки.
И отпечатался.
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 8 месяцев

Сообщений: 1179


Shassukkum · 19-Авг-13 12:34 (спустя 13 часов)

Loexa писал(а):
60532561Вроде не было других изданий. "На китайской земле", воспоминания советских добровольцев, 2-ое издание, дополненное, 1975 год.
Оно? → http://www.ozon.ru/context/detail/id/2440615/
[Профиль]  [ЛС] 

Loexa

Стаж: 15 лет

Сообщений: 566

Loexa · 19-Авг-13 18:38 (спустя 6 часов)

Shassukkum писал(а):
60538146Оно? →
Да, точно. 77 год.
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 8 месяцев

Сообщений: 1179


Shassukkum · 19-Авг-13 19:24 (спустя 46 мин.)

Пришёл сегодня на работу, открыл книжку над которой не так давно работал (http://www.ozon.ru/context/detail/id/3098510/), и вспомнил Ваш скан, вместе с сканом Arlandok'а)) Это там где гарнитура та же - "Обыкновенная новая", с засечками и тонкими перемычками. Просто кошмар. Буквы "и", "п" и "н" пришли к единому модулю.
Эх-х, оставлю пока как есть, драфтовый вариант пусть пока будет, благо не Ваш случай, можно другое издание поискать.
[Профиль]  [ЛС] 

albal74

Стаж: 15 лет 3 месяца

Сообщений: 105

albal74 · 23-Авг-13 18:22 (спустя 3 дня, ред. 23-Авг-13 18:22)

Почему-то на Выводе функция "Применить к..." не работает.
Выбираю, к примеру, "Применить к всем страницам", в результате ничего не происходит.
Приходится каждую страницу просматривать и выбирать нужные параметры
[Профиль]  [ЛС] 

$Shorox

Стаж: 15 лет 9 месяцев

Сообщений: 1673

$Shorox · 23-Авг-13 18:50 (спустя 28 мин.)

albal74
В ST бывает такой глюк. Иногда в этом случае помогает изменение варианта "Применить к этой и последующим страницам". Или пару страниц обработать вручную и снова нажать "Применить ...".
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 14 лет 10 месяцев

Сообщений: 6109

DjVu-Master · 23-Авг-13 19:20 (спустя 29 мин.)

albal74 писал(а):
60592026Почему-то на Выводе функция "Применить к..." не работает.
Выбираю, к примеру, "Применить к всем страницам", в результате ничего не происходит.
Приходится каждую страницу просматривать и выбирать нужные параметры
У меня все и всегда работало на любых версиях.
[Профиль]  [ЛС] 

aa666

Стаж: 17 лет 10 месяцев

Сообщений: 412


aa666 · 26-Авг-13 10:54 (спустя 2 дня 15 часов)

Можно ли от файнридера как-нибудь получить ocr слой с посимвольной детализацией?
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 8 месяцев

Сообщений: 1179


Shassukkum · 26-Авг-13 12:18 (спустя 1 час 23 мин.)

aa666 писал(а):
60624859Можно ли от файнридера как-нибудь получить ocr слой с посимвольной детализацией?
Т.е?
Не пословно а побуквенно?
[Профиль]  [ЛС] 

aa666

Стаж: 17 лет 10 месяцев

Сообщений: 412


aa666 · 26-Авг-13 12:40 (спустя 22 мин.)

угу.
похоже, такая инфа остается при сохранении в пдф.
есть что-нибудь типа DjvuOCR для пдф-а? чтобы выковырять ее в читабельном виде?
[Профиль]  [ЛС] 

Shassukkum

Стаж: 15 лет 8 месяцев

Сообщений: 1179


Shassukkum · 26-Авг-13 14:10 (спустя 1 час 30 мин.)

А, насчёт PDF - не ко мне)
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error