Вопрос по определению качества книг

Страницы:  1
Тема закрыта
 

FlorElena

Стаж: 16 лет 7 месяцев

Сообщений: 25

FlorElena · 16-Июн-08 16:31 (16 лет 7 месяцев назад, ред. 16-Июн-08 16:32)

Подскажите, пожалуйста, что такое "OCR без ошибок" и "OSR с ошибками", и как вообще выглядят эти варианты, а также отсканированные страницы ( если можно- скриншоты всех 3 вариантов, чтобы визуально сравнить)
[Профиль]  [ЛС] 

AndrewSSS

Стаж: 18 лет 6 месяцев

Сообщений: 1393

AndrewSSS · 17-Июн-08 06:01 (спустя 13 часов)

Визуально сравнить - это примерно так.
Допустим, у нас PDF-файл, один из них - OCR, другой - скан страниц...
Открываем их по-очереди, ставим на увеличение 500-600% или ещё больше, и пробуем смотреть на буковки....
Это о второй части вопроса.
Что такое OCR - это лучше в поисковике спросить, и почитать...
[Профиль]  [ЛС] 

DjVu-Master

Стаж: 15 лет 1 месяц

Сообщений: 6135

DjVu-Master · 17-Сен-11 00:59 (спустя 3 года 2 месяца, ред. 17-Сен-11 00:59)

Я это понимаю так:
OCR без ошибок - напечатаный текст (не картинка) без ошибок ("каллиграфических" ).
OCR с ошибками - ............................................................ с ошибоками. - когда Файнридером текст распознали и не проверили на ошибки в "правописании".
Цитата:
и как вообще выглядят эти варианты
Отсканированные страницы

Распознанный текст без ошибок (OCR)
[Профиль]  [ЛС] 

mpv777

Admin gray

Стаж: 16 лет 9 месяцев

Сообщений: 32142

mpv777 · 18-Сен-11 11:52 (спустя 1 день 10 часов, ред. 18-Сен-11 11:52)

Stepanenko.P.V. писал(а):
OCR без ошибок - напечатаный текст (
Это тот же распознанный текст, только "вычитанный" после распознавания
Правила оформления раздач в разделе Книги
Цитата:
* Отсканированные страницы - просто картинки, которые были переделаны конверторами в основном в PDF или DJVU. Это же качество относится к книгам в JPEG и др. графических форматах.
* OCR - это оптическое распознавание символов (англ. Optical Character Recognition). — механическая или электронная конвертация изображений символов и букв в текст, редактируемый на компьютере. Перевод осуществляется программным путём, после получения изображения со сканера или фото. Текст, преобразованный из графической формы в символьную (текстовую), можно далее обрабатывать любыми текстовыми редакторами. Т.е. это либо перепечатанная вручную книга, или же распознанная через сканер, отличается от отсканированных страниц всегда хорошим качеством, возможностью поиска по тексту, выделением и копированием текста.
* eBook (изначально компьютерное) - вообще eBook это любая книга в цифровом формате, т.е. книги, изначально созданные как компьютерный текст (текст с графикой).
[Профиль]  [ЛС] 
 
Тема закрыта
Loading...
Error