Есть собственноручно отсаканированная в TIFF книжка.
Редкий язык (шведский)
С горем пополам собрала её из TIFF в DJVU, прогнав через FR-11
Но упорно не сохраняется в DJVU текстовой слой, хотя в окне FR он отображается, т.е. FR его все же сделал:
В FR-11
Тот же файл в WinDJView
Как добавить в такой DJVU текстовой слой?
Возможное не распознает из-за редкого языка? Но в настройках FR он проставлен.
Чтобы оставался в сохранности и "картинковый". Картинковый оставляю потому, что язык редкий и сложный. В вычитывать его вот прям параллельно с распознаванием я не могу. Надо чтобы потом, если в процессе чтения-копирования текстового слоя вылезут огрехи, чтобы можно было сравнить с оригиналом.
Про Book Restorer знаю, не могу совладать с функционалом и настройками. Я блондинка.
СканТейлор, который здесь советуют, установлю позже, "сдать" DJVU с распознанным слоем надо через 2 дня, хочется сделать его быстро, пусть даже для первого раза не идеально.
--------------------------
UPD. Вопрос решен. У меня все это время всего лишь режим просмотра DJVU, а не "выделить текст"
Вот, в целом, у был такой алгоритм "Моя первая DJVU книга". Может кому пригодится )))
Этап первый, работа с разрозненныеми картинковыми сканами каждой страницы отдельно.
1. Постраничное сканирование обычным сканером. Лучше в формат TIFF, хотя он и весит намного больше JPG
2. В ACDSee или ином аналоге кропом обрезать лишние куску странниц, оставшиеся при сканировании черные поля и т.д. Стараться, чтобы размер кропа был одинаковым на всем листах.
3. По желанию вручную подчистить в Фотошопе различные мелкие дефекты картинки.
4. Еще раз проверит нумерацию страниц
Этап второй, создание первичного DJVU файла. Он легче по весу чем PDF, открывается быстрее.
1. Открыть прогу FineReader (далее FR) (лучше версию 11, но вроде бы можно и другие, от 8-й)
2. Поставить нужный язык распознавания (Рус, анг+рус, французский, немецкий и т.д.)
Можно проставить галочками несколько языков сразу. Смотря какие языки использованы в отсканированной книжке.
3. загрузить все картинковые файлы, прогнать, рспознать (но на данном этапе распознавание скорее всего не сработает, про это будет ниже).
4. "Сохранить как" DJVU
5. На выходе имеем вместо папки с картинками-страницами весом в 2 Гб один многостраничный файл DJVU весом около 1,5 Мб. Единообразие внешнего вида страничек зависит от того, насколько аккуратно был использован crop при обработке картинок на первом этапе, убраны ли мелкие дефекты изображения в фотошопе и т.д.
6. Проверить, есть ли в DJVU текстовой слой. Не забыть (как это было у меня в первый раз) переключиться с режима "Просмотр" на "Выделить текст" на базовой панели инструментов вашего просмотровика DJVU
Этап три. Добавление в DJVU текстового слоя (ORC), если он не появился автоматом.
1. Открыть FR. Как уже советовали выше по треду, нужна версия программы не ниже ABBYY FineReader 11.0.102.
583 Corporate Edition Rus полная версия. (проверить свою версию FR: Cправка - О программе)
2. Как и в первом случает, прогоняем либо папку с TIFF через этот новый FR11, сделать распознавание нужными языками и т.д.
3. "Сохранить как" - "DJVU"
4. Должен появиться текстовой слой.
Этап 4, если текстовой слой все равно не появляется.
1. Скачивается и запускается прога DjvuOCR v2.4 beta4 full
2. Прогнать через неё полученный в FR11 (вер.583...)файл DJVU
3. Вот теперь точно должен появиться текстовой слой.
-----
Прощу прощения у старожилов если открываю Америку и есть более грамотные способы создания DJVU, с вычищенными тенями от корешка и автоматической подгонкой наклона-кропа (а не в ACD-See, как это делала я) и т.д. Но у меня впервые получилось сделать DJVU книжку с ORCи я довольна как слон.