|
|
|
reduktorer
Стаж: 17 лет 11 месяцев Сообщений: 117
|
reduktorer ·
01-Янв-14 21:55
(12 лет 4 месяца назад)
При склеивании 2-х кусков, действовал по алгоритму описанному выше. Но посередине получается полоса размытости текста шириной где-то 2-3 см.
Подскажите, пожалуйста, в чем может быть проблема.
|
|
|
|
DjVu-Master
 Стаж: 16 лет 4 месяца Сообщений: 6115
|
DjVu-Master ·
01-Янв-14 22:14
(спустя 18 мин.)
reduktorer писал(а):
62346328Но посередине получается полоса размытости текста шириной где-то 2-3 см.
Флажки в одних и тех же точках были выставлены?
|
|
|
|
Loexa
 Стаж: 16 лет 5 месяцев Сообщений: 565
|
Loexa ·
01-Янв-14 22:20
(спустя 5 мин.)
reduktorer
https://rutr.life/forum/viewtopic.php?t=4199335 читали? Там несколько вариантов предложено.
|
|
|
|
reduktorer
Стаж: 17 лет 11 месяцев Сообщений: 117
|
reduktorer ·
01-Янв-14 22:55
(спустя 35 мин., ред. 01-Янв-14 22:55)
DjVu-Master писал(а):
Флажки в одних и тех же точках были выставлены?
Конечно, более того увеличивал настолько что флажки ставил не просто над точкой над украинской буквой i, а по верхнему правому краю точки над i. То есть уже до моразма доходило, что выставлял флажки на мельчайших черных точечках, без которых не обходится бумага, т.е. микрозагрязнения. Не помогает. Параметры выставлены как показано в примере. Видимо придется пробовать другие параметры, не могу выдать конечный продукт с такими погрешностями.
Благодарю. Эту ссылку я как-то пропустил. Будем пробовать.
|
|
|
|
DjVu-Master
 Стаж: 16 лет 4 месяца Сообщений: 6115
|
DjVu-Master ·
02-Янв-14 17:50
(спустя 18 часов, ред. 03-Янв-14 00:38)
reduktorer
Выложите мне тех два куска сканов. Update/
Вот еще один мой "видео шедевр".
Обработка
Для справки
reduktorer писал(а):
Здравствуйте. Вот эти куски сканов(речь идет о внутреннем развороте журнала, то есть высылаю 4 куска):
http://files.mail.ru/FF8766330A3840A0A94A10AE773841A8
Здесь страницы подвергаются двойному склеиванию. Я выслал результаты первого склеивания (1-101), уже пошла размытость, пробовал несколько раз, она не проходит. Как понимаете, когда эти склеенные страницы склеить еще раз между собой как 1-2, этот эффект усилится. Причем эта размытость появляется не на всех страницах. Есть очень хорошо склееные страницы без размытости, но попадаются вот такие размытости, которые не могу устранить повторными попытками. Не хотелось бы выкладывать такой продукт.
DjVu-Master писал(а):
Короче щас догружу видео и дам ссылку - посмотрите что и как я делал. Что скажу:
1. такой мелкий текст надо при 600дпи сканировать. Минимум 400!
2. класть ровнее листы на сканер и прижимать их хорошо - может тогда не будет засветов при склейке листов.
|
|
|
|
Dark_Ambient
  Стаж: 18 лет 2 месяца Сообщений: 16498
|
Dark_Ambient ·
03-Янв-14 14:56
(спустя 21 час)
расскажите кто-нибудь как слой распознанного текста в DjVu и PDF сделать
|
|
|
|
$Shorox
 Стаж: 17 лет 2 месяца Сообщений: 1673
|
$Shorox ·
03-Янв-14 15:58
(спустя 1 час 1 мин., ред. 03-Янв-14 15:58)
Dark_Ambient
Тщательно, до буквы не делаю распознавание. Глаз и времени не хватит на это. Для большинства книг так делаю:
Для PDF
Запускаю ABBYY FineReader. Выставляю язык распознавания: например цифры, русский.
В ABBYY FineReader открываю обработанные сканы. Программа распознает их. После этого начинаю пролистывать страницы.
В левой части окна программы - правильно выставляю границы областей, меняю их типы (если неправильно распознались), в таблицах ориентацию меняю если надо и так далее.
Если на странице встречаются фразы на другом языке (например английском), то выставляю дополнительно этот язык и снова распознаю эту страницу.
В правой части окна программы - если вижу неправильно распознанные символы, то с клавиатуры их заменяю.
Эти замены автоматом запоминаются, после них распознавание уже не надо делать. Для DjVu
То же самое, только сохраняю в DjVu и выдёргиваю из неё OCR-слой программой Djvu.OCR.v2.4b.Rus
Делаю по такой схеме:
Схема создания книги DjVu
ScanTailor - выравниваем страницы и и так далее..
ST Split - отделяем текст от картинок.
DjVu Small - кодируем текст.
Adobe Photoshop - обработка картинок.
DjVu Imager - вклеиваем картинки. Получаю Djvu (без OCR-слоя).
ABBYY FineReader - создание (из неразделённых сканов) книги в формате DjVu с OCR-слоем.
DjvuOCR - извлечение из неё OCR-слоя и добавление в Djvu (без OCR-слоя)
HandyOutliner for DjVu-PD - создание оглавления.
Книга готова.
|
|
|
|
Dark_Ambient
  Стаж: 18 лет 2 месяца Сообщений: 16498
|
Dark_Ambient ·
03-Янв-14 16:03
(спустя 5 мин.)
Вытащил из DjVu тиффы, распознал через FR10, получил doc или txt
направил их в Djvu.OCR
и..... ничего не произошло
|
|
|
|
Shassukkum
Стаж: 17 лет 1 месяц Сообщений: 1178
|
Shassukkum ·
03-Янв-14 17:55
(спустя 1 час 51 мин., ред. 03-Янв-14 17:55)
Dark_Ambient писал(а):
62366180Вытащил из DjVu тиффы, распознал через FR10, получил doc или txt
направил их в Djvu.OCR
и..... ничего не произошло
Э-э, каким это образом можно "doc или txt" запихнуть в Djvu.OCR?
Проясните ситуацию пожалуйста.
Dark_Ambient писал(а):
62366180Для DjVu
<...>
ST Split - отделяем текст от картинок.
<...>
Не надо этого уже'. STF давно сам это делает.
Чего народ в оману вводишь?)
|
|
|
|
Dark_Ambient
  Стаж: 18 лет 2 месяца Сообщений: 16498
|
Dark_Ambient ·
03-Янв-14 20:38
(спустя 2 часа 43 мин.)
Shassukkum писал(а):
62367533Э-э, каким это образом можно "doc или txt" запихнуть в Djvu.OCR?
не знаю
что туда нужно запихать?
пробовал по этой схеме http://file-djvu.ru/djvu-ocr
|
|
|
|
Shassukkum
Стаж: 17 лет 1 месяц Сообщений: 1178
|
Shassukkum ·
03-Янв-14 21:29
(спустя 50 мин.)
Dark_Ambient писал(а):
62369921что туда нужно запихать?
Строго говоря, "туда нужно запихать" или пакет от FR v.8 или v.9.0.724 или выцарапанный OCR из DjVu файла, полученный из FR v.11.0.113.164 и вылеченный FR11 DjVu Text Layer Crutch v0.21 Про 10-ю версию я давно забыл по ряду важных причин. Если Вам всё же интересно - почему, могу прокомментировать, только многа букафф будет.
Не-не-не, отказать. Делайте или по схеме предложенной DjVu-Master'ом, если Вам чем-то 11-я версия не угодила или по моей, если решились идти в ногу со временем. .164-я, вполне стабильна и на 7-ке и на ХР.
|
|
|
|
Dark_Ambient
  Стаж: 18 лет 2 месяца Сообщений: 16498
|
Dark_Ambient ·
04-Янв-14 06:27
(спустя 8 часов)
ладно, спасибо
обойдусь пожалуй без этих интерактивных оглавлений и распознанных слоев
|
|
|
|
Shassukkum
Стаж: 17 лет 1 месяц Сообщений: 1178
|
Shassukkum ·
04-Янв-14 13:17
(спустя 6 часов)
Dark_Ambient писал(а):
62374502ладно, спасибо
обойдусь пожалуй без этих интерактивных оглавлений и распознанных слоев
хозяин-барин.
|
|
|
|
DjVu-Master
 Стаж: 16 лет 4 месяца Сообщений: 6115
|
DjVu-Master ·
04-Янв-14 13:24
(спустя 6 мин.)
Dark_Ambient
Цитата:
Без труда не выловишь и рыбку из пруда
|
|
|
|
Dark_Ambient
  Стаж: 18 лет 2 месяца Сообщений: 16498
|
Dark_Ambient ·
04-Янв-14 13:29
(спустя 5 мин.)
какой труд? понаделали каких-то сомнительных программ, которые не работают
|
|
|
|
DjVu-Master
 Стаж: 16 лет 4 месяца Сообщений: 6115
|
DjVu-Master ·
04-Янв-14 14:41
(спустя 1 час 11 мин., ред. 04-Янв-14 14:41)
Dark_Ambient писал(а):
62377656понаделали каких-то сомнительных программ, которые не работают
У меня в начале тоже ничего не работало.
Цитата:
Но я сделал это говно!
|
|
|
|
Dark_Ambient
  Стаж: 18 лет 2 месяца Сообщений: 16498
|
Dark_Ambient ·
04-Янв-14 15:01
(спустя 20 мин.)
DjVu-Master
распознать-то в FR10 TIFF несложно
дальше-то что делать?
|
|
|
|
DjVu-Master
 Стаж: 16 лет 4 месяца Сообщений: 6115
|
DjVu-Master ·
04-Янв-14 15:49
(спустя 47 мин., ред. 04-Янв-14 15:49)
Dark_Ambient писал(а):
62378812дальше-то что делать?
Вечером покажу как делать. Видосик сниму.
P.S. Если хватит сил после зала.
|
|
|
|
Shassukkum
Стаж: 17 лет 1 месяц Сообщений: 1178
|
Shassukkum ·
04-Янв-14 16:36
(спустя 47 мин., ред. 04-Янв-14 16:36)
Dark_Ambient писал(а):
62377656понаделали каких-то сомнительных программ, которые не работают
Уважаемый Dark_Ambient, Ваше негодование мне вполне понятно. Ведь хочется такую программку что бы, нажал одну кнопочку - и всё получилось! За сим - в компанию ABBYY, но боюсь Вы ещё долго будете ждать от них нормального, вра-зу-ми-тель-ного кодировщика в DjVu, да и в другие форматы тоже. Поэтому, добрые люди и сделали некоторые "дополнения" к тому на что так до сих пор и не сподобилась Abbyy. Затянувшийся кризис понимания между разрабами FR'ок и оцифровщиками, тому причиной.
Поэтому, сначала следует определиться что Вам надо, или корявый текстовый слой в DjVu'хе (типа - не- вольный вместо невольный, как в оригинале книги) или качественная OCR в книге.
Я настоятельно рекомендую перейти на 8-ю; 9.0.724-ю или 11.0.113.164-ю версии ФаинРидера.
По 8-й версии, спрашивайте у DjVu-Master'а, по 11-ой - смотрите мой ролик. Будут вопросы - пишите.
|
|
|
|
DjVu-Master
 Стаж: 16 лет 4 месяца Сообщений: 6115
|
DjVu-Master ·
04-Янв-14 21:44
(спустя 5 часов)
Dark_Ambient
Смотрел ваши раздачи (пару штук). Это ваши работы?
|
|
|
|
Shassukkum
Стаж: 17 лет 1 месяц Сообщений: 1178
|
Shassukkum ·
05-Янв-14 15:02
(спустя 17 часов, ред. 05-Янв-14 16:03)
|
|
|
|
Dark_Ambient
  Стаж: 18 лет 2 месяца Сообщений: 16498
|
Dark_Ambient ·
05-Янв-14 15:10
(спустя 8 мин.)
DjVu-Master
какие именно?
|
|
|
|
DjVu-Master
 Стаж: 16 лет 4 месяца Сообщений: 6115
|
DjVu-Master ·
05-Янв-14 15:34
(спустя 23 мин., ред. 05-Янв-14 15:34)
Dark_Ambient писал(а):
62393825какие именно?
PDF-ы по 50 и больше метров?
З.Ы.
Цитата:
Не указан - Октябрьские дни в Сокольниках по воспоминаниям участников. [1922, DjVu, RUS]
Уберите с названия темы.
|
|
|
|
Dark_Ambient
  Стаж: 18 лет 2 месяца Сообщений: 16498
|
Dark_Ambient ·
05-Янв-14 15:48
(спустя 13 мин.)
DjVu-Master писал(а):
62394133PDF-ы по 50 и больше метров?
мое обычно вот такое:
https://rutr.life/forum/viewtopic.php?t=4632861
|
|
|
|
Loexa
 Стаж: 16 лет 5 месяцев Сообщений: 565
|
Loexa ·
05-Янв-14 18:04
(спустя 2 часа 16 мин.)
Dark_Ambient
Полей нет. Размеры страниц разные. И портрет автора надо бы подшаманить.
|
|
|
|
DjVu-Master
 Стаж: 16 лет 4 месяца Сообщений: 6115
|
DjVu-Master ·
05-Янв-14 20:29
(спустя 2 часа 24 мин.)
Ну, норм. ДжВю на 5 метров.
А то те PDF-ы по 50 и больше метров можно ужать тоже до 5-10.
|
|
|
|
Irbys27
  Стаж: 16 лет 2 месяца Сообщений: 2452
|
Irbys27 ·
08-Янв-14 07:08
(спустя 2 дня 10 часов)
$Shorox писал(а):
61409216Исправление дефектов отсканированных страниц книги в GIMP1. В книге была порвана и неровно склеена страница.
Открываем страницу в GIMP.
Выбираем в "Панели инструментов" инструмент "Свободное выделение (Лассо)" - выделяем (обводим) с помощью мышки контур ->
Уважаемый, почему у меня свободное выделение получается не таким как на вашем скрине? Прошел мышкой по линии порыва страницы, получилось вот что:
|
|
|
|
$Shorox
 Стаж: 17 лет 2 месяца Сообщений: 1673
|
$Shorox ·
08-Янв-14 08:38
(спустя 1 час 30 мин.)
Arlandok
У Вас вроде тоже самое, что и у меня на скринах.
У меня страница разорвана на два куска, у Вас разорвана на три.
У меня "Выбираем в "Панели инструментов" инструмент "Свободное выделение (Лассо)" - выделяем (обводим) с помощью мышки контур ->" - обведен полностью нижний кусок страницы.
У Вас "Выбираем в "Панели инструментов" инструмент "Свободное выделение (Лассо)" - выделяем (обводим) с помощью мышки контур ->" - обведен полностью средний кусок страницы.
Я разницы не вижу и понять не могу, что у Вас не получается.
|
|
|
|
Irbys27
  Стаж: 16 лет 2 месяца Сообщений: 2452
|
Irbys27 ·
08-Янв-14 09:22
(спустя 43 мин.)
$Shorox, немного разобрался, до шага "сохранить". Какой способ сохранения нужно выбрать в ниспадающем окошке?
|
|
|
|
$Shorox
 Стаж: 17 лет 2 месяца Сообщений: 1673
|
$Shorox ·
08-Янв-14 09:28
(спустя 5 мин., ред. 08-Янв-14 09:28)
Arlandok
Обычно я сохраняю как "Перезаписать".
Справку получить по функции -> Выбрать функцию и нажать F1.
|
|
|
|