FAQ по сборке (созданию) DjVu книги из сырых сканов

Страницы :   Пред.  1, 2, 3 ... 5, 6, 7 ... 40, 41, 42  След.
Ответить
 

reduktorer

Стаж: 17 лет 11 месяцев

Сообщений: 117


reduktorer · 01-Янв-14 21:55 (12 лет 4 месяца назад)

При склеивании 2-х кусков, действовал по алгоритму описанному выше. Но посередине получается полоса размытости текста шириной где-то 2-3 см.
Подскажите, пожалуйста, в чем может быть проблема.
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 16 лет 4 месяца

Сообщений: 6115

DjVu-Master · 01-Янв-14 22:14 (спустя 18 мин.)

reduktorer писал(а):
62346328Но посередине получается полоса размытости текста шириной где-то 2-3 см.
Флажки в одних и тех же точках были выставлены?
[Профиль]  [ЛС] 

Loexa

Стаж: 16 лет 5 месяцев

Сообщений: 565

Loexa · 01-Янв-14 22:20 (спустя 5 мин.)

reduktorer
https://rutr.life/forum/viewtopic.php?t=4199335 читали? Там несколько вариантов предложено.
[Профиль]  [ЛС] 

reduktorer

Стаж: 17 лет 11 месяцев

Сообщений: 117


reduktorer · 01-Янв-14 22:55 (спустя 35 мин., ред. 01-Янв-14 22:55)

DjVu-Master писал(а):
Флажки в одних и тех же точках были выставлены?
Конечно, более того увеличивал настолько что флажки ставил не просто над точкой над украинской буквой i, а по верхнему правому краю точки над i. То есть уже до моразма доходило, что выставлял флажки на мельчайших черных точечках, без которых не обходится бумага, т.е. микрозагрязнения. Не помогает. Параметры выставлены как показано в примере. Видимо придется пробовать другие параметры, не могу выдать конечный продукт с такими погрешностями.
Loexa писал(а):
62346581reduktorer
https://rutr.life/forum/viewtopic.php?t=4199335 читали? Там несколько вариантов предложено.
Благодарю. Эту ссылку я как-то пропустил. Будем пробовать.
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 16 лет 4 месяца

Сообщений: 6115

DjVu-Master · 02-Янв-14 17:50 (спустя 18 часов, ред. 03-Янв-14 00:38)

reduktorer
Выложите мне тех два куска сканов.
Update/
Вот еще один мой "видео шедевр".
Обработка
Для справки
reduktorer писал(а):
Здравствуйте. Вот эти куски сканов(речь идет о внутреннем развороте журнала, то есть высылаю 4 куска):
http://files.mail.ru/FF8766330A3840A0A94A10AE773841A8
Здесь страницы подвергаются двойному склеиванию. Я выслал результаты первого склеивания (1-101), уже пошла размытость, пробовал несколько раз, она не проходит. Как понимаете, когда эти склеенные страницы склеить еще раз между собой как 1-2, этот эффект усилится. Причем эта размытость появляется не на всех страницах. Есть очень хорошо склееные страницы без размытости, но попадаются вот такие размытости, которые не могу устранить повторными попытками. Не хотелось бы выкладывать такой продукт.

DjVu-Master писал(а):
Короче щас догружу видео и дам ссылку - посмотрите что и как я делал.
Что скажу:
1. такой мелкий текст надо при 600дпи сканировать. Минимум 400!
2. класть ровнее листы на сканер и прижимать их хорошо - может тогда не будет засветов при склейке листов.
[Профиль]  [ЛС] 

Dark_Ambient

Top Seed 09* 10240r

Стаж: 18 лет 2 месяца

Сообщений: 16498

Dark_Ambient · 03-Янв-14 14:56 (спустя 21 час)

расскажите кто-нибудь как слой распознанного текста в DjVu и PDF сделать
[Профиль]  [ЛС] 

$Shorox

Стаж: 17 лет 2 месяца

Сообщений: 1673

$Shorox · 03-Янв-14 15:58 (спустя 1 час 1 мин., ред. 03-Янв-14 15:58)

Dark_Ambient
Тщательно, до буквы не делаю распознавание. Глаз и времени не хватит на это. Для большинства книг так делаю:
Для PDF
Запускаю ABBYY FineReader. Выставляю язык распознавания: например цифры, русский.
В ABBYY FineReader открываю обработанные сканы. Программа распознает их. После этого начинаю пролистывать страницы.
В левой части окна программы - правильно выставляю границы областей, меняю их типы (если неправильно распознались), в таблицах ориентацию меняю если надо и так далее.
Если на странице встречаются фразы на другом языке (например английском), то выставляю дополнительно этот язык и снова распознаю эту страницу.
В правой части окна программы - если вижу неправильно распознанные символы, то с клавиатуры их заменяю.
Эти замены автоматом запоминаются, после них распознавание уже не надо делать.
Для DjVu
То же самое, только сохраняю в DjVu и выдёргиваю из неё OCR-слой программой Djvu.OCR.v2.4b.Rus
Делаю по такой схеме:
Схема создания книги DjVu
ScanTailor - выравниваем страницы и и так далее..
ST Split - отделяем текст от картинок.
DjVu Small - кодируем текст.
Adobe Photoshop - обработка картинок.
DjVu Imager - вклеиваем картинки. Получаю Djvu (без OCR-слоя).
ABBYY FineReader - создание (из неразделённых сканов) книги в формате DjVu с OCR-слоем.
DjvuOCR - извлечение из неё OCR-слоя и добавление в Djvu (без OCR-слоя)
HandyOutliner for DjVu-PD - создание оглавления.
Книга готова.
[Профиль]  [ЛС] 

Dark_Ambient

Top Seed 09* 10240r

Стаж: 18 лет 2 месяца

Сообщений: 16498

Dark_Ambient · 03-Янв-14 16:03 (спустя 5 мин.)

Вытащил из DjVu тиффы, распознал через FR10, получил doc или txt
направил их в Djvu.OCR
и..... ничего не произошло
[Профиль]  [ЛС] 

Shassukkum

Стаж: 17 лет 1 месяц

Сообщений: 1178


Shassukkum · 03-Янв-14 17:55 (спустя 1 час 51 мин., ред. 03-Янв-14 17:55)

Dark_Ambient писал(а):
62366180Вытащил из DjVu тиффы, распознал через FR10, получил doc или txt
направил их в Djvu.OCR
и..... ничего не произошло
Э-э, каким это образом можно "doc или txt" запихнуть в Djvu.OCR?
Проясните ситуацию пожалуйста.
Dark_Ambient писал(а):
62366180Для DjVu
<...>
ST Split - отделяем текст от картинок.
<...>
Не надо этого уже'. STF давно сам это делает.
Чего народ в оману вводишь?)
[Профиль]  [ЛС] 

Dark_Ambient

Top Seed 09* 10240r

Стаж: 18 лет 2 месяца

Сообщений: 16498

Dark_Ambient · 03-Янв-14 20:38 (спустя 2 часа 43 мин.)

Shassukkum писал(а):
62367533Э-э, каким это образом можно "doc или txt" запихнуть в Djvu.OCR?
не знаю
что туда нужно запихать?
пробовал по этой схеме http://file-djvu.ru/djvu-ocr
[Профиль]  [ЛС] 

Shassukkum

Стаж: 17 лет 1 месяц

Сообщений: 1178


Shassukkum · 03-Янв-14 21:29 (спустя 50 мин.)

Dark_Ambient писал(а):
62369921что туда нужно запихать?
Строго говоря, "туда нужно запихать" или пакет от FR v.8 или v.9.0.724 или выцарапанный OCR из DjVu файла, полученный из FR v.11.0.113.164 и вылеченный FR11 DjVu Text Layer Crutch v0.21 Про 10-ю версию я давно забыл по ряду важных причин. Если Вам всё же интересно - почему, могу прокомментировать, только многа букафф будет.
Цитата:
пробовал по этой схеме http://file-djvu.ru/djvu-ocr
Не-не-не, отказать. Делайте или по схеме предложенной DjVu-Master'ом, если Вам чем-то 11-я версия не угодила или по моей, если решились идти в ногу со временем. .164-я, вполне стабильна и на 7-ке и на ХР.
[Профиль]  [ЛС] 

Dark_Ambient

Top Seed 09* 10240r

Стаж: 18 лет 2 месяца

Сообщений: 16498

Dark_Ambient · 04-Янв-14 06:27 (спустя 8 часов)

ладно, спасибо
обойдусь пожалуй без этих интерактивных оглавлений и распознанных слоев
[Профиль]  [ЛС] 

Shassukkum

Стаж: 17 лет 1 месяц

Сообщений: 1178


Shassukkum · 04-Янв-14 13:17 (спустя 6 часов)

Dark_Ambient писал(а):
62374502ладно, спасибо
обойдусь пожалуй без этих интерактивных оглавлений и распознанных слоев
хозяин-барин.
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 16 лет 4 месяца

Сообщений: 6115

DjVu-Master · 04-Янв-14 13:24 (спустя 6 мин.)

Dark_Ambient
Цитата:
Без труда не выловишь и рыбку из пруда
[Профиль]  [ЛС] 

Dark_Ambient

Top Seed 09* 10240r

Стаж: 18 лет 2 месяца

Сообщений: 16498

Dark_Ambient · 04-Янв-14 13:29 (спустя 5 мин.)

какой труд? понаделали каких-то сомнительных программ, которые не работают
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 16 лет 4 месяца

Сообщений: 6115

DjVu-Master · 04-Янв-14 14:41 (спустя 1 час 11 мин., ред. 04-Янв-14 14:41)

Dark_Ambient писал(а):
62377656понаделали каких-то сомнительных программ, которые не работают
У меня в начале тоже ничего не работало.
Цитата:
Но я сделал это говно!
[Профиль]  [ЛС] 

Dark_Ambient

Top Seed 09* 10240r

Стаж: 18 лет 2 месяца

Сообщений: 16498

Dark_Ambient · 04-Янв-14 15:01 (спустя 20 мин.)

DjVu-Master
распознать-то в FR10 TIFF несложно
дальше-то что делать?
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 16 лет 4 месяца

Сообщений: 6115

DjVu-Master · 04-Янв-14 15:49 (спустя 47 мин., ред. 04-Янв-14 15:49)

Dark_Ambient писал(а):
62378812дальше-то что делать?
Вечером покажу как делать. Видосик сниму.
P.S. Если хватит сил после зала.
[Профиль]  [ЛС] 

Shassukkum

Стаж: 17 лет 1 месяц

Сообщений: 1178


Shassukkum · 04-Янв-14 16:36 (спустя 47 мин., ред. 04-Янв-14 16:36)

Dark_Ambient писал(а):
62377656понаделали каких-то сомнительных программ, которые не работают
Уважаемый Dark_Ambient, Ваше негодование мне вполне понятно. Ведь хочется такую программку что бы, нажал одну кнопочку - и всё получилось! За сим - в компанию ABBYY, но боюсь Вы ещё долго будете ждать от них нормального, вра-зу-ми-тель-ного кодировщика в DjVu, да и в другие форматы тоже. Поэтому, добрые люди и сделали некоторые "дополнения" к тому на что так до сих пор и не сподобилась Abbyy. Затянувшийся кризис понимания между разрабами FR'ок и оцифровщиками, тому причиной.
Поэтому, сначала следует определиться что Вам надо, или корявый текстовый слой в DjVu'хе (типа - не- вольный вместо невольный, как в оригинале книги) или качественная OCR в книге.
Я настоятельно рекомендую перейти на 8-ю; 9.0.724-ю или 11.0.113.164-ю версии ФаинРидера.
По 8-й версии, спрашивайте у DjVu-Master'а, по 11-ой - смотрите мой ролик. Будут вопросы - пишите.
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 16 лет 4 месяца

Сообщений: 6115

DjVu-Master · 04-Янв-14 21:44 (спустя 5 часов)

Dark_Ambient
Смотрел ваши раздачи (пару штук). Это ваши работы?
[Профиль]  [ЛС] 

Shassukkum

Стаж: 17 лет 1 месяц

Сообщений: 1178


Shassukkum · 05-Янв-14 15:02 (спустя 17 часов, ред. 05-Янв-14 16:03)

...
[Профиль]  [ЛС] 

Dark_Ambient

Top Seed 09* 10240r

Стаж: 18 лет 2 месяца

Сообщений: 16498

Dark_Ambient · 05-Янв-14 15:10 (спустя 8 мин.)

DjVu-Master
какие именно?
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 16 лет 4 месяца

Сообщений: 6115

DjVu-Master · 05-Янв-14 15:34 (спустя 23 мин., ред. 05-Янв-14 15:34)

Dark_Ambient писал(а):
62393825какие именно?
PDF-ы по 50 и больше метров?
З.Ы.
Цитата:
Не указан - Октябрьские дни в Сокольниках по воспоминаниям участников. [1922, DjVu, RUS]
Уберите с названия темы.
[Профиль]  [ЛС] 

Dark_Ambient

Top Seed 09* 10240r

Стаж: 18 лет 2 месяца

Сообщений: 16498

Dark_Ambient · 05-Янв-14 15:48 (спустя 13 мин.)

DjVu-Master писал(а):
62394133PDF-ы по 50 и больше метров?
мое обычно вот такое:
https://rutr.life/forum/viewtopic.php?t=4632861
[Профиль]  [ЛС] 

Loexa

Стаж: 16 лет 5 месяцев

Сообщений: 565

Loexa · 05-Янв-14 18:04 (спустя 2 часа 16 мин.)

Dark_Ambient
Полей нет. Размеры страниц разные. И портрет автора надо бы подшаманить.
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 16 лет 4 месяца

Сообщений: 6115

DjVu-Master · 05-Янв-14 20:29 (спустя 2 часа 24 мин.)

Dark_Ambient писал(а):
62394361мое обычно вот такое:
https://rutr.life/forum/viewtopic.php?t=4632861
Ну, норм. ДжВю на 5 метров.
А то те PDF-ы по 50 и больше метров можно ужать тоже до 5-10.
[Профиль]  [ЛС] 

Irbys27

Top Seed 05* 640r

Стаж: 16 лет 2 месяца

Сообщений: 2452

Irbys27 · 08-Янв-14 07:08 (спустя 2 дня 10 часов)

$Shorox писал(а):
61409216Исправление дефектов отсканированных страниц книги в GIMP1. В книге была порвана и неровно склеена страница.
Открываем страницу в GIMP.
Выбираем в "Панели инструментов" инструмент "Свободное выделение (Лассо)" - выделяем (обводим) с помощью мышки контур ->
скрытый текст
Уважаемый, почему у меня свободное выделение получается не таким как на вашем скрине? Прошел мышкой по линии порыва страницы, получилось вот что:
[Профиль]  [ЛС] 

$Shorox

Стаж: 17 лет 2 месяца

Сообщений: 1673

$Shorox · 08-Янв-14 08:38 (спустя 1 час 30 мин.)

Arlandok
У Вас вроде тоже самое, что и у меня на скринах.
У меня страница разорвана на два куска, у Вас разорвана на три.
У меня "Выбираем в "Панели инструментов" инструмент "Свободное выделение (Лассо)" - выделяем (обводим) с помощью мышки контур ->" - обведен полностью нижний кусок страницы.
У Вас "Выбираем в "Панели инструментов" инструмент "Свободное выделение (Лассо)" - выделяем (обводим) с помощью мышки контур ->" - обведен полностью средний кусок страницы.
Я разницы не вижу и понять не могу, что у Вас не получается.
[Профиль]  [ЛС] 

Irbys27

Top Seed 05* 640r

Стаж: 16 лет 2 месяца

Сообщений: 2452

Irbys27 · 08-Янв-14 09:22 (спустя 43 мин.)

$Shorox, немного разобрался, до шага "сохранить". Какой способ сохранения нужно выбрать в ниспадающем окошке?
[Профиль]  [ЛС] 

$Shorox

Стаж: 17 лет 2 месяца

Сообщений: 1673

$Shorox · 08-Янв-14 09:28 (спустя 5 мин., ред. 08-Янв-14 09:28)

Arlandok
Обычно я сохраняю как "Перезаписать".
Справку получить по функции -> Выбрать функцию и нажать F1.
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error