|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
13-Июл-13 13:43
(11 лет 4 месяца назад, ред. 13-Июл-13 20:45)
$Shorox
Записал видео от А до Я. Обалдеете!
Толбко оно 1.2 Гб вышло. Ща подумаю куда залить.
Цитата:
Продолжительность: 4 ч. 19 м.
https://rutr.life/forum/viewtopic.php?t=4486865
|
|
Irbys27
Стаж: 14 лет 9 месяцев Сообщений: 2428
|
Irbys27 ·
08-Авг-13 08:20
(спустя 25 дней)
Можно ли как-нибудь сохранить оригинальный шрифт при распознавании этой страницы?
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
08-Авг-13 09:10
(спустя 50 мин.)
Arlandok
Надо доп. шрифты подключать. А как - я без понятия. И не факт что получится.
Отсканируйте при 400 дпи и выведите после обработки в 400 либо в 600. И подшейте слой распознанного текста.
|
|
Ezrah
Стаж: 17 лет Сообщений: 466
|
Ezrah ·
09-Авг-13 17:39
(спустя 1 день 8 часов)
Процедура в FAQ оказалась чрезмерно усложненной. Я выбрал default для всех страниц, но цветная страница и в итоговом djvu осталась цветной)))
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
09-Авг-13 17:53
(спустя 13 мин.)
Ezrah писал(а):
60418032Я выбрал default для всех страниц, но цветная страница и в итоговом djvu осталась цветной)))
Возьмите закодируйте одну и ту же цвет. стр. профилем default и photo и сравните качество.
|
|
albal74
Стаж: 15 лет 3 месяца Сообщений: 105
|
albal74 ·
15-Авг-13 10:14
(спустя 5 дней)
DjVu-Master Спасибо огромное!
|
|
Irbys27
Стаж: 14 лет 9 месяцев Сообщений: 2428
|
Irbys27 ·
16-Авг-13 10:21
(спустя 1 день)
Подскажите, как управлять функцией "распрямление строк" в Scan Tailor Futured"? Что-то у меня эта функция не работает.
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
16-Авг-13 11:19
(спустя 57 мин.)
Arlandok писал(а):
60499392Подскажите, как управлять функцией "распрямление строк" в Scan Tailor Futured"? Что-то у меня эта функция не работает.
Сам в замешательстве.
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
16-Авг-13 12:32
(спустя 1 час 13 мин.)
Arlandok писал(а):
60499392Подскажите, как управлять функцией "распрямление строк" в Scan Tailor Futured"? Что-то у меня эта функция не работает.
А какой Вы версией пользуетесь?
Переходите сразу на СТФ, советую
скрытый текст
Там есть замечательное "краевое" выравнивание.
|
|
Irbys27
Стаж: 14 лет 9 месяцев Сообщений: 2428
|
Irbys27 ·
18-Авг-13 14:19
(спустя 2 дня 1 час)
Shassukkum
Не помогла замена версий. Вот страница, попробуйте сами
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
18-Авг-13 15:42
(спустя 1 час 23 мин., ред. 18-Авг-13 15:42)
Arlandok писал(а):
60526968Shassukkum
Не помогла замена версий. Вот страница, попробуйте сами
А и не поможет. Любая версия. Я о краевом выравнивании говорил.
Вот что удалось получить после БукРесторера
Офигеть, почти каждому третьему — FAQ не помог.
Неужели на трекере так много матёрых оцифровщиков книг и журналов?
|
|
Loexa
Стаж: 15 лет Сообщений: 566
|
Loexa ·
18-Авг-13 19:52
(спустя 4 часа, ред. 18-Авг-13 19:52)
Shassukkum писал(а):
60527160Офигеть, почти каждому третьему — FAQ не помог.
А я предупреждал, что мягше надо, мягше... И легше:)
Кстати, у Arlandok точно такие же огрехи между буквами, как и в моём случае. И гарнитура та же - "Обыкновенная новая". Не удивлюсь, если и типография та же самая.
Есть соображения, что делать с межбуквенныи кляксами?
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
18-Авг-13 20:32
(спустя 39 мин.)
Loexa писал(а):
60530237
Shassukkum писал(а):
60527160Офигеть, почти каждому третьему — FAQ не помог.
А я предупреждал, что мягше надо, мягше... И легше:)
))
Цитата:
Кстати, у Arlandok точно такие же огрехи между буквами, как и в моём случае. И гарнитура та же - "Обыкновенная новая". Не удивлюсь, если и типография та же самая.
Ух-ты, классная тема. К сожалению я не программер и в этих вопросах не бум-бум. Еле с командной строкой управляюсь)
Так что подписываюсь к теме.
Цитата:
Есть соображения, что делать с межбуквенныи кляксами?
А покажите пжлст "сырой" скан. Если таковой, конечно, остался.
|
|
Loexa
Стаж: 15 лет Сообщений: 566
|
Loexa ·
18-Авг-13 20:55
(спустя 23 мин., ред. 18-Авг-13 22:06)
Shassukkum, вот:
Сырой скан:
После ScanTailor:
Про Фотошоп я маленько наврал - не нашёл к нему фильтр Median Cross. Вот после XnView+GIMP:
C фотошоповским Median выходит ещё хуже.
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
18-Авг-13 21:05
(спустя 10 мин.)
Ясно. Подозреваю, то что Вы сделали, сделать лучше нельзя. Можно ещё пройтись БукРесторером, это там где удаление точек, что-бы мелочь всякую почистить точечную, (напр. в слове — "Это убедительно показывает") а вот "отрезки" ... хм-м ... скажу честно, в подобных случаях я ищу другое издание. Просматриваю книгу на наличие таких и подобных дефектов печати. Уж-если совсем никуда, то оставляю как есть, не вычищать же каждый скан от этих клякс? Так и не один месяц можно угробить на работу.
Так что лучше, пожалуй, и не сделать.
|
|
Loexa
Стаж: 15 лет Сообщений: 566
|
Loexa ·
18-Авг-13 21:19
(спустя 13 мин.)
Shassukkum писал(а):
60532359скажу честно, в подобных случаях я ищу другое издание
Вроде не было других изданий. "На китайской земле", воспоминания советских добровольцев, 2-ое издание, дополненное, 1975 год.
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
18-Авг-13 21:56
(спустя 37 мин.)
Я-тут поупражнялся немного, на ночь глядючи.
Есть такой замечательный фриварный сборник, под названием mehdiplugins. Там есть плуг → Flat Median 1.4.
Качаете, кидаете в папку к плугам в ФШ.
Вот что у меня получилось, предварительно:
До
После
Поиграйтесь с тремя ползунками, может чего интересного и выйдет (в плане вертикальных клякс, да впрочем и др. вида, тоже). Обратите внимание как я "боролся" с "1 гг. обст".
Завтра ещё на работе его покручу, сегодня устал.
|
|
Loexa
Стаж: 15 лет Сообщений: 566
|
Loexa ·
18-Авг-13 22:35
(спустя 39 мин.)
Shassukkum писал(а):
60533048Есть такой замечательный фриварный сборник, под названием mehdiplugins. Там есть плуг → Flat Median 1.4.
Тоже костыль, конечно, но попробую. А то уже склоняюсь к методу Степаненко - перевёрстке.
Кстати, алгоритм был такой:
первый слой - бинаризованный оригинал, второй слой обработан Median cross, радиус 11, с небольшими разрывами букв.
Выделение белого Color Range.
Уменьшение выделения на 2-3 пиксела.
Удаление слоя.
Удаление всего, вошедшего в выделение.
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
18-Авг-13 22:50
(спустя 15 мин.)
Loexa писал(а):
60533538
Shassukkum писал(а):
60533048Есть такой замечательный фриварный сборник, под названием mehdiplugins. Там есть плуг → Flat Median 1.4.
Тоже костыль, конечно, но попробую. А то уже склоняюсь к методу Степаненко - перевёрстке.
Если надумаете перевёрстывать, то лучше сразу в векторный PDF.
Опять же так, в плане пожеланий
Цитата:
Кстати, алгоритм был такой:
первый слой - бинаризованный оригинал, второй слой обработан Median cross, радиус 11, с небольшими разрывами букв.
Выделение белого Color Range.
Уменьшение выделения на 2-3 пиксела.
Удаление слоя.
Удаление всего, вошедшего в выделение.
Прикольно, надо опробовать по случаю.
А вообще, если бумага с досками попадается ("рубили вместе с будкой") то я такие сканы прогоняю сначала через ФШ, убираю по цвету доски, (сканы у меня всегда в колоре). т.е максимально избавляюсь от всякого такого лишнего.
Понял на собственной шкуре, лучше почистить максимально возможно сканы чем потом ручками в СТ корячиться, обводить кляксы. Теперь вот и плуг подвернулся.
("как я его сразу для этих целей не определил??")
|
|
Loexa
Стаж: 15 лет Сообщений: 566
|
Loexa ·
18-Авг-13 23:14
(спустя 23 мин., ред. 18-Авг-13 23:14)
Shassukkum писал(а):
60533743Если надумаете перевёрстывать, то лучше сразу в векторный PDF.
Согласен.
Цитата:
А вообще, если бумага с досками попадается
Тоже согласен.
Но там явно шрифт убитый. Или литеры изношены, или их так изначально криво отлили. Огрехи в одних и тех же местах.
Насколько знаю, до конца 20го века готовые литеры набирали в пазы на наборной доске. Потом заливали свинцом и получали матрицу для печати.
А вот этот набор был или кривой, или изношен, и свинец затёк в промежутки.
И отпечатался.
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
19-Авг-13 12:34
(спустя 13 часов)
Loexa писал(а):
60532561Вроде не было других изданий. "На китайской земле", воспоминания советских добровольцев, 2-ое издание, дополненное, 1975 год.
Оно? → http://www.ozon.ru/context/detail/id/2440615/
|
|
Loexa
Стаж: 15 лет Сообщений: 566
|
Loexa ·
19-Авг-13 18:38
(спустя 6 часов)
Shassukkum писал(а):
60538146Оно? →
Да, точно. 77 год.
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
19-Авг-13 19:24
(спустя 46 мин.)
Пришёл сегодня на работу, открыл книжку над которой не так давно работал ( http://www.ozon.ru/context/detail/id/3098510/), и вспомнил Ваш скан, вместе с сканом Arlandok'а)) Это там где гарнитура та же - "Обыкновенная новая", с засечками и тонкими перемычками. Просто кошмар. Буквы "и", "п" и "н" пришли к единому модулю.
Эх-х, оставлю пока как есть, драфтовый вариант пусть пока будет, благо не Ваш случай, можно другое издание поискать.
|
|
albal74
Стаж: 15 лет 3 месяца Сообщений: 105
|
albal74 ·
23-Авг-13 18:22
(спустя 3 дня, ред. 23-Авг-13 18:22)
Почему-то на Выводе функция "Применить к..." не работает.
Выбираю, к примеру, "Применить к всем страницам", в результате ничего не происходит.
Приходится каждую страницу просматривать и выбирать нужные параметры
|
|
$Shorox
Стаж: 15 лет 9 месяцев Сообщений: 1673
|
$Shorox ·
23-Авг-13 18:50
(спустя 28 мин.)
albal74
В ST бывает такой глюк. Иногда в этом случае помогает изменение варианта "Применить к этой и последующим страницам". Или пару страниц обработать вручную и снова нажать "Применить ...".
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
23-Авг-13 19:20
(спустя 29 мин.)
albal74 писал(а):
60592026Почему-то на Выводе функция "Применить к..." не работает.
Выбираю, к примеру, "Применить к всем страницам", в результате ничего не происходит.
Приходится каждую страницу просматривать и выбирать нужные параметры
У меня все и всегда работало на любых версиях.
|
|
aa666
Стаж: 17 лет 10 месяцев Сообщений: 412
|
aa666 ·
26-Авг-13 10:54
(спустя 2 дня 15 часов)
Можно ли от файнридера как-нибудь получить ocr слой с посимвольной детализацией?
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
26-Авг-13 12:18
(спустя 1 час 23 мин.)
aa666 писал(а):
60624859Можно ли от файнридера как-нибудь получить ocr слой с посимвольной детализацией?
Т.е?
Не пословно а побуквенно?
|
|
aa666
Стаж: 17 лет 10 месяцев Сообщений: 412
|
aa666 ·
26-Авг-13 12:40
(спустя 22 мин.)
угу.
похоже, такая инфа остается при сохранении в пдф.
есть что-нибудь типа DjvuOCR для пдф-а? чтобы выковырять ее в читабельном виде?
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
26-Авг-13 14:10
(спустя 1 час 30 мин.)
А, насчёт PDF - не ко мне)
|
|
|