Кхе Кхе...
Нусс, начнём...
И начнём с самого начала!
JNight писал(а):
"Примеры страниц" выглядят как среднего качества сканы.
И так оно и есть!
Кусок 18-й страницы. Масштаб 100%
Тобишь, тут глаз не подвёл...
nankaipai писал(а):
поиск по тексту работает, текст можно скопировать.
А сдесь на сцену выходит спецификация формата DjVu. А именно:
ВикипедиЯ писал(а):
DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлять полнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовывать удобную навигацию в DjVu-книгах.
Во как!
Тобишь, OCR -
незримо присутствует! (Именно
незримо, это важно
)
Иии... Приходим к выводу, что надпись "
Качество: OCR с ошибками" всё-таки, не корректна
"Ошибки OCR", в данном случае, незримы (как и сам OCR слой
), до тех пор, пока вы не попробуете скопировать "текст" в буфер. Извлеченный текст будет содержать все прелести "OCR с ошибкам"
нераспознанные иероглифы, съехавший формат и непосредственно ошибки OCR.
На моё ИМХО, сие есть несомненный плюс! Поскольку при чтении с экрана и распечатке - никаких "ошибок OCR" - нет.
(Пока не захотите сделать на основе сего документа реферат или курсовой по филологии
)
Ну, а считать данный
изврат симбиоз - OCR или нет - это к администрации
nankaipai: Оясуминасай