|
Irbys27
  Стаж: 15 лет 7 месяцев Сообщений: 2446
|
Irbys27 ·
19-Фев-13 18:49
(12 лет 7 месяцев назад)
Спасибо, я уже разобрался как что делать, и с кромсатором тоже более менее решаю проблемы (жаль русификтора нет), за вашу ссылку скантэйлор тоже отдельное спасибо.
|
|
Shassukkum
Стаж: 16 лет 6 месяцев Сообщений: 1178
|
Shassukkum ·
19-Фев-13 22:54
(спустя 4 часа)
zlobny_sow писал(а):
57969012Но вам лучше подойдет 11-ый FineReader: он в разы лучше распознаёт, чем 7-ой или 9-ый.
Arlandok писал(а):
57969472У меня, кстати, 10-я версия.
Stepanenko.P.V. писал(а):
57971880Для меня самая лучшая версия ФР это 8-мая.
Вообщем я понял. Пора здесь писать мануал по оцифровке с помощью 11-ой версии ФР.
Там свои подводные камни, кой чего нового в этом вопросе возникло. Постараюсь соорудить на выходных, с картинками))
|
|
danilamaster245
 Стаж: 13 лет 11 месяцев Сообщений: 88
|
danilamaster245 ·
20-Фев-13 22:03
(спустя 23 часа, ред. 20-Фев-13 22:21)
Оставляю свой положительный отзыв на счет 11-версии FineReader.
Лучше точно 10 версии,размер файлов PDF и Djvu практически сравнялся.Сжимает 10-ю версию.
Распознает хорошо,почти не проверяю.
На работе старый комп тянет ХР,материнка MSI 6570 K7N2,amd xp 2500+,PC3200 -3Гб,сканер EPSON STYLUS CX7300. 
40 листов за 35 минут без редактирования только сканирование 300dip,распознавание,сохранение.
На большее времени нет,много работы.
|
|
mr_johnny
Стаж: 16 лет 4 месяца Сообщений: 100
|
mr_johnny ·
20-Фев-13 22:05
(спустя 1 мин.)
Может кто-то сделать видеоурок по ScanKromsator , очень нужно(
|
|
SI{AY
 Стаж: 17 лет 6 месяцев Сообщений: 1409
|
SI{AY ·
20-Фев-13 23:37
(спустя 1 час 32 мин.)
mr_johnny, в первом же сообщений расписано подробнее некуда.
|
|
DjVu-Master
 Стаж: 15 лет 9 месяцев Сообщений: 6122
|
DjVu-Master ·
21-Фев-13 02:49
(спустя 3 часа)
danilamaster245 писал(а):
5799193540 листов за 35 минут
Это ч/б?
|
|
mr_johnny
Стаж: 16 лет 4 месяца Сообщений: 100
|
mr_johnny ·
21-Фев-13 14:10
(спустя 11 часов)
как выствлять линии обрезки в ScanKromsator? впритык к тексту или с запасом по краям? и как добится чтоб выходные фойлы после Process! имели одинаковый размер по высоте и ширине
|
|
Irbys27
  Стаж: 15 лет 7 месяцев Сообщений: 2446
|
Irbys27 ·
21-Фев-13 16:31
(спустя 2 часа 21 мин.)
mr_johnny Значения над стрелкой отвечают за размеры по ширине и высоте, изменяются, когда передвигаешь бегунок. Линии обрезки можно выставить впритык и установить рамку поширше, можно с запасом, тогда размер рамки поменьше.
mr_johnny
|
|
danilamaster245
 Стаж: 13 лет 11 месяцев Сообщений: 88
|
danilamaster245 ·
21-Фев-13 17:05
(спустя 34 мин., ред. 21-Фев-13 17:05)
Stepanenko.P.V. писал(а):
57995275
danilamaster245 писал(а):
5799193540 листов за 35 минут
Это ч/б?
Я сканирую Вестник ЗОЖ обложку в цвете 300 и середину в цвете,остальные в ч/б с оттенками серого.
Если интересно напишите на эл.почту объясню как делаю. 
В ч/б варианте текст книги получится быстрее.В программе всё предусмотрено обрезка листа происходит передвижением определеной рамки(которую вы сами расширяете мышкой)
Настройка яркости,контрасности и прочего коррекция искажений ит.п. все перед распознаванием делается.
Возьмите пробную версию посмотрите всё по русски написано.
http://www.abbyy.ru/finereader-pro/specification/
Пылинки я не убираю не до них они убираются яркостью и контрасностью и уровнями.
Емкость 40 стр. всего 2Мб скорость сканирования 2,5секунды ч/б,3,5секунды цветной по паспорту сканера.
Если книга влезет в формат А4 то программа сама разделяет страницы или не разделяет как вам нужно.
|
|
Shassukkum
Стаж: 16 лет 6 месяцев Сообщений: 1178
|
Shassukkum ·
24-Фев-13 15:15
(спустя 2 дня 22 часа)
yuree писал(а):
57977583
zlobny_sow писал(а):
57969012Но вам лучше подойдет 11-ый FineReader: он в разы лучше распознаёт, чем 7-ой или 9-ый.
Arlandok писал(а):
57969472У меня, кстати, 10-я версия.
Stepanenko.P.V. писал(а):
57971880Для меня самая лучшая версия ФР это 8-мая.
Вообщем я понял. Пора здесь писать мануал по оцифровке с помощью 11-ой версии ФР.
Там свои подводные камни, кой чего нового в этом вопросе возникло. Постараюсь соорудить на выходных, с картинками))
Написанное ниже можно считать манулалом к ФР11, впрочем можно таковым его и не считать.
Довольно много оцифровщиков печатной продукции используют в своей работе Abbyy FineReader восьмой версии. Она цениться за надёжность, достаточное количество настроек, удобство и внутреннее очарование) Всё бы хорошо, если только речь заходит об оцифровке русскоязычной литературы. Украинской, английской, немецкой. Т.е. "базовых" языков, если можно так выразиться. Но когда перед оцифровщиком стои'т задача перевода в электронный формат какого-либо учебника восточных языков (китайский, японский, корейский, арабский и т.д.) или будь то просто манга (японский, английский) или ... список можно продолжать достаточно долго, тогда, начинается самое интересное. Восьмая версия не поддерживает иероглифику, тем более словарь, и перевод наследия Срединного Царства превращается в муку-мученическую. Добавьте сюда всяких кришнаитов со своим санскритским или буддистов, коими полна земля русская, со своим тибетским. Экзотика, скажете вы, да не совсем. Учебные материалы вышедшие в советское и постсоветское время не потеряли актуальности до наших дней, и с ними надо как-то работать, как-то текстовый слой к ним присобачить. Восьмая версия этого сделать не может.
Ко всему прочему, хоть и вяло на мой взгляд, но не без интереса общественность начинает возрождать из пепла всё то печатное которое было выпущено в дореволюционное время, и соответственно, в дореволюционной орфографии. Восьмая версия не может произвести оцифровку в силу того что, хотя-бы, объём подключаемого словаря к программе достаточно мал. То же касается и всех других необходимых языков которых нет в списке Abbyy.
Итак, я покажу на примере оцифровки дореформного издания, так сказать, совмещу два в одном.
1. Качаем последнюю версию ФР11. У меня стои'т 11.0.110.122. Можно и пониже взять, но только что бы она не была ниже 11.0.102.583. Устанавливаем. Запускаем.
2. Создаём "новый" язык на основе "Русский (Старая Орфография)". Устанавливаем чек в "Пользовательский словарь" → "Свойства". Грузим туда наш словарь проверки дореформки. → ОК → ОК. Дополняем необходимыми языками распознавания (если то необходимо), цифры.
Далее я покажу на примере DjVu файла. Допустим он у нас уже' есть, назовём его Оригинал, к примеру.
3. Грузим Оригинал в ФР, распознаём, уверяю вас, подчёркиваний становиться гораздо меньше и соответственно вычитка упрощается в разы.
4. Далее есть несколько вариантов развития сюжета.
а) Можно перегнать распознанный текст в Ворд, поправить и соорудить из него PDF'ку. См. напр. здесь → https://rutr.life/forum/viewtopic.php?t=3653520
б) Можно сохранить его в формате fb2 напр. для последующего перевода на гражданский русский язык, с помощью модуля замены к программе Иероглиф и последующей редактурой в одном из fb2-редакторов.
в) Можно сохранить в DjVu формате с последующем выдиранием OCR слоя, редактуры его и внедрения в наш Оригинальный DjVu файл. Остановимся на этом подробнее.
До сих пор Abbyy FineReader не может нормально сохранять не в PDF не в DjVu форматах, ("собственно как и в других тоже, кроме текстового))") поэтому добрый человек под никнеймом NME или N.M.E. соорудил батник для устранения косяков. Дабы долго не рассказывать о том кто виноват в неправильном сохранении текстового слоя расскажу о том, что делать.
У нас есть DjVu файл полученный при распознании в ФР11, назовём его "Копия". Текстовый слой, с мягкими переносами. Далее всё стандартно. С помощью DjVu OCR выдираем OCR слой из нашей "Копии" → внедряем его в наш "Оригинал" → запускаем FR11 DjVu Text Layer Crutch или можно скачать по прямой ссылке [url=http:// СПАМ → Указываем наш Оригинал с OCR слоем → Открыть → Сохранить. Методику сохранения выбираем №1 (по умолчанию).
Маленькое дополнение. При оцифровке могут попадаться сложные слова, типа, "Нан-Мадол" или "физико-химические". Когда текст при распознавании размещён вот так
... физико-хими¬
ческие ...
То всё нормально, при помощи FR11 DjVu Text Layer Crutch мягкий перенос уберётся и в поисковике будет выглядеть как "физико-химические". Но есть другой вариант.
Когда текст при распознавании размещён вот так
... физико-
химические ...
Тогда после тире надо ставить вручную мягкий перенос.
... физико- ¬
химические ...
Иначе текст в поисковике надо задавать так "физико- химические" а не так "физико-химические".
Таких слов довольно мало в тексте, но лучше всё доводить как надо, я так считаю.
В итоге. Используя ФР11 и эту нехитрую методику внедрения OCR слоя к нашей DjVu книге, журналу, можно повысить скорость распознавания, оцифровывать иероглифику для учебников, словарей и т.д., применять различные пользовательские словари с запредельным количеством слов ("Позор! Даже для белорусского надо словарь создавать! Впрочем, он уже' создан))" ) и многое другое.
Наконец-то поиск по DjVu файлу приобрёл человеческое лицо.
На этом пока всё. Простите что без пикч))
|
|
Boch
  Стаж: 17 лет 8 месяцев Сообщений: 3198
|
Boch ·
02-Мар-13 14:02
(спустя 5 дней, ред. 02-Мар-13 14:02)
SI{AY писал(а):
57993712mr_johnny, в первом же сообщений расписано подробнее некуда.
Кромсатор выдаёт сообщение (после того как включаю - process) : - что не так я делал?
Cutting lines обозначены же, - какие ещё действия нужно озадачить для кромсатора.
|
|
aa666
Стаж: 18 лет 8 месяцев Сообщений: 395
|
aa666 ·
02-Мар-13 15:14
(спустя 1 час 11 мин.)
Boch
галка "Split" стоит, а ползунков у корешка нет
|
|
Boch
  Стаж: 17 лет 8 месяцев Сообщений: 3198
|
Boch ·
02-Мар-13 15:53
(спустя 39 мин.)
aa666 Так их и нет. Делаю всё как на первой странице. Каких ползунков у корешка - это по центру книги?
По краям же для обрезки есть. Что не так??
Закрыл этот кромсатор - режу с помощью XnView - правда она только режет, но не чистит??
|
|
Shassukkum
Стаж: 16 лет 6 месяцев Сообщений: 1178
|
Shassukkum ·
02-Мар-13 16:02
(спустя 8 мин.)
Boch писал(а):
58153393aa666
Закрыл этот кромсатор - режу с помощью XnView - правда она только режет, но не чистит??
А резка сканов в СканТейлоре Вам принципиально не подходит?
|
|
Boch
  Стаж: 17 лет 8 месяцев Сообщений: 3198
|
Boch ·
02-Мар-13 16:09
(спустя 7 мин., ред. 02-Мар-13 16:09)
yuree Так проблема не в этом же.
Что не так я сделал в Кромсаторе??
У меня антивирус Нортон, а Тейлор вроде как не подходит к нему. Вместо помощи одни вопросы.
|
|
Shassukkum
Стаж: 16 лет 6 месяцев Сообщений: 1178
|
Shassukkum ·
02-Мар-13 16:24
(спустя 14 мин.)
Boch писал(а):
58153614yuree Так проблема не в этом же.
Что не так я сделал в Кромсаторе??
У меня антивирус Нортон, а Тейлор вроде как не подходит к нему. Вместо помощи одни вопросы.
А, ну-ладно. Простите я не по Кромсатору. Но что-то мне подсказывает что антивир не имеет никакого отношения к СТ. Впрочем, не об этом вопрос)
|
|
aa666
Стаж: 18 лет 8 месяцев Сообщений: 395
|
aa666 ·
02-Мар-13 17:25
(спустя 1 час)
Boch писал(а):
58153393Что не так??
aa666 писал(а):
58152783галка "Split" стоит
, что означает что вы хотите порезать страницу на 2, а где резать - не указали (вернее, указали, но неправильно)
либо на закладке Page снимите Split, либо поставьте резаки у корешка
|
|
Boch
  Стаж: 17 лет 8 месяцев Сообщений: 3198
|
Boch ·
03-Мар-13 09:37
(спустя 16 часов)
aa666 писал(а):
58154965
Boch писал(а):
58153393Что не так??
aa666 писал(а):
58152783галка "Split" стоит
, что означает что вы хотите порезать страницу на 2, а где резать - не указали (вернее, указали, но неправильно)
либо на закладке Page снимите Split, либо поставьте резаки у корешка
Ладно), доделаю книгу (если получится), - нет её в сети; давно уже, лет как 10 наблюдаю, а если пропадёт у меня? пусть будет хоть в хранилище сети интернет.
Но у меня много вопросов):
1. Так как я сканировал разворотами (т.е. по две страницы) - их 121, без обложек, то - обязательно ли ставить на первом этапе ( п. 2.1 ScanKromsator v5.92) - резки и т.п. - галочку Split на всех разворотах? (ведь так рекомендовано на 1-й странице темы). И ставить её нажав на Ctrl - чтобы эта опция действовала на всех разворотах автоматически. Или для каждого разворота, для первого этапа галочку Split нужно ставить отдельно каждый раз. 2. Что означает - что вы хотите порезать страницу на 2 - у меня же разворот, не страница - на "моём" развороте 2-ве страницы.
Нужно ли резать (т.е., обозначать?? середину - корешок) такой разворот. Если я не ставлю галочку Split - то я не хочу порезать страницу (вернее, наверно, разворот с 2-мя страницами).
А нужно ли это делать - резать страницу - разворот??
Если не нужно то я не ставлю галочку Split и не режу - не ставлю резаки - в середине? разворота (где корешок). Почему вы пишите - резаки - м.б. достаточно одного вертикального резака?
Т.е., если я режу разворот (зачем?) - ставлю галочку Split (и это рекомендовано на 1-й странице), то - нужно обозначить - 4 резака по краям разворота и два (или один) в середине?? Так?
Если не режу разворот, - не ставлю галочку Split, то - я обозначаю только 4 резака по краям разворота?
Нужно ли на этом этапе резать вообще (или не резать - по центру) тоже и обложки книги или они потом как-то далее "кромсатируются" или "файнридируются"/лизардируются? 3. Кроме того, программа может сохранять сделанные настройки в виде сведений о заданиях (Tasks) - где это в Кромсаторе??
П. 2.2 Препроцессинг и расстановка границ и 2.3 Опции обработки - здесь, во вкладке-команде Draft Kromsate меню Edit - нужно, чтобы любые изменения (установка галочки, буквы, цифры в квадрат окон опций Draft Kromsate) сохранились автоматически для всех разворотов - обязательно держать нажатой клавишу - Shift?? При этом Кромсатор показывает окно подтверждения - для всех.
В рекомендациях 1-й страницы: - п. 2.2 Препроцессинг и расстановка границ, в Draft Kromsate, вкладке - Options, в строке Profile Name, стоит - Standart Book render - в моём кромсаторе (последнем, 5.93) такого нет, по умолчанию стоит - Дефаулт.
в п. 2.3 Опции обработки - Вкладка Options 2 - Вкладка Quality -
Первое, что нужно сделать на этой вкладке - держа Ctrl, установить галочку Gray Enhance (улучшить в градациях серого). Затем щелкаем по самой надписи, и попадаем в окно настройки дополнительных параметров Gray image enhance. -
здесь у меня Кромсатор не открывает это окно Gray image enhance, пишет, что - у вас уже всё установлено - как так, почему??
Сами листы книги - абрикосового цвета; номера страниц внизу - зелёного цвета; текст и фотографии, рисунок - ч/б, на абрикосового цвета бумаге. Так всё и отсканировалось разворотами. Нужно ли в п. 2. что-то дополнительно, ставить галочки? - или там, помнится, есть галочка Gray - которая превратит абрикосовый цвет страниц в - серый?
П. 2.4 Подготовка рисунков - у меня на разворотах: фотографии на обоих страницах; либо текст на одной, фото на другой; да, и один рисунок - схема маршрутов. Обязательно ли нужно проходить этот этап 2.4?? 4. Шаг 3. Распознавание и первичная вычитка - обязателен ли этот этап??
Это нужно скачивать и устанавливать для одной "моей" книги - Адоб Файн Ридер?? - великий и ужасный.
Чтобы распознать текст книги. Файн Ридер же не превращает tiff файлы в DjVu.
Может сразу переходить к - DjVu-редактору LizardTech Document Express Editor 6.0.1.
И здесь у меня проблема: в рекомендациях пишется - Диалог настройки в LizardTech Document Express Enterprise вынесен в отдельное приложение, называемое Configuration Manager
У меня после установки этого LizardTech Document Express Editor 6.0.1 - нет отдельного приложения Configuration Manager. Есть в самой программе опция настройки где профили - но они отдельно не ставятся - так для всего сразу, похоже.
Нужно же создать/открыть окна отдельных профилей - профилей кодирования для каждого типа разворота??: абрикосового цвета (или он переделается кромсатором в серый) разворотов, фото, обложек, одного рисунка.
Всего, книга с обложками в tiff файлах занимает около 2.5 Гб.
|
|
Shassukkum
Стаж: 16 лет 6 месяцев Сообщений: 1178
|
Shassukkum ·
03-Мар-13 12:23
(спустя 2 часа 46 мин.)
Boch писал(а):
58165600Ладно), доделаю книгу (если получится), - нет её в сети; давно уже, лет как 10 наблюдаю, а если пропадёт у меня? пусть будет хоть в хранилище сети интернет.
Спасибо.
Цитата:
Но у меня много вопросов): Сами листы книги - абрикосового цвета; номера страниц внизу - зелёного цвета; текст и фотографии, рисунок - ч/б, на абрикосового цвета бумаге. Так всё и отсканировалось разворотами. Нужно ли в п. 2. что-то дополнительно, ставить галочки? - или там, помнится, есть галочка Gray - которая превратит абрикосовый цвет страниц в - серый?
В Фотошопе можно убрать "абрикосовый" фон ("собственно говоря как и любой другой, если нет этой опции в сканере") → https://rutr.life/forum/viewtopic.php?p=46673913#46673913
Цитата:
Файн Ридер же не превращает tiff файлы в DjVu.
Превращает.
|
|
Boch
  Стаж: 17 лет 8 месяцев Сообщений: 3198
|
Boch ·
03-Мар-13 15:03
(спустя 2 часа 40 мин.)
yuree Да рано спасибо. Пока с вопросами не разберусь, дальше не начну.
На первой странице написано, что создание PDF книги - в Файн Ридере, но не DjVu книги.
DjVu книга создаётся Лизардом. Зачем тогда приводят пример с Лизардом, если в Файн Ридере всё типы книг/файлов можно сделать??
|
|
DjVu-Master
 Стаж: 15 лет 9 месяцев Сообщений: 6122
|
DjVu-Master ·
03-Мар-13 15:14
(спустя 10 мин., ред. 03-Мар-13 15:14)
Boch
Цитата:
3 года 6 месяцев назад, ред. 29-Мар-10 13:21
Тогда еще ФР не умел сохранять в DjVu.
Но я даже сейчас пользуюсь ФР8. Распознаю, сохраняю в ПДФ и перевожу PDF2DJVU в DjVu.
|
|
Shassukkum
Стаж: 16 лет 6 месяцев Сообщений: 1178
|
Shassukkum ·
03-Мар-13 15:15
(спустя 38 сек.)
Boch писал(а):
58170795yuree
Зачем тогда приводят пример с Лизардом, если в Файн Ридере всё типы книг/файлов можно сделать??
Ну-у, все не все, но многие. Впрочем ФР корёжит и PDF и DjVu и fb2 и т. д., так что приходиться в редакторах, "догонять".
... а привели потому что заглавное сообщение этой темы (урок по оцифровке) написан ещё за царя Гороха. Очень многое что поменялось в представленных автором программах, а значит и поменялся подход к оцифровке.
|
|
dmnfff000
  Стаж: 15 лет 9 месяцев Сообщений: 299
|
dmnfff000 ·
03-Мар-13 17:05
(спустя 1 час 50 мин., ред. 03-Мар-13 17:05)
Товарищи, подскажите пожалуйста какой сканер лучше взять(на замену старому): HP ScanJet G3110 или Epson Perfection v37 Нужно для сканирования книг, а в дальнейшем журналов (в журналах в основном одни фотографии)
|
|
Shassukkum
Стаж: 16 лет 6 месяцев Сообщений: 1178
|
Shassukkum ·
03-Мар-13 17:14
(спустя 8 мин.)
dmnfff000 писал(а):
58172936Товарищи, подскажите пожалуйста какой сканер лучше взять(на замену старому): HP ScanJet G3110 или Epson Perfection v37 Нужно для сканирования книг, а в дальнейшем журналов (в журналах в основном одни фотографии)
https://rutr.life/forum/viewtopic.php?t=3999333
|
|
DjVu-Master
 Стаж: 15 лет 9 месяцев Сообщений: 6122
|
DjVu-Master ·
03-Мар-13 17:15
(спустя 23 сек.)
dmnfff000 писал(а):
58172936Нужно для сканирования книг
Судя по вашему аватару - сатанинских?
|
|
Shassukkum
Стаж: 16 лет 6 месяцев Сообщений: 1178
|
Shassukkum ·
03-Мар-13 17:19
(спустя 4 мин.)
Stepanenko.P.V. писал(а):
58173101
dmnfff000 писал(а):
58172936Нужно для сканирования книг
Судя по вашему аватару - сатанинских? 
Да нормальный там аватар. Кстати этот дядька с аватара (Шандор ла Вэй), Библию Сатаны написал, если мне память не изменяет  Книжка прикольная, если что.
|
|
DjVu-Master
 Стаж: 15 лет 9 месяцев Сообщений: 6122
|
DjVu-Master ·
03-Мар-13 17:30
(спустя 11 мин.)
yuree
Антон Лавей - основатель сатанинской церкви.
|
|
zlobny_sow
 Стаж: 16 лет 4 месяца Сообщений: 207
|
zlobny_sow ·
03-Мар-13 18:10
(спустя 39 мин., ред. 03-Мар-13 18:10)
dmnfff000
В местах, где сканируют книги, хвалят Epson Perfection — будто недорогой относительно и шустрый. Собираюсь себе тоже такой купить. А так, если не стоит вопрос в деньгах, то конечно Plustek OpticBook.
|
|
Irbys27
  Стаж: 15 лет 7 месяцев Сообщений: 2446
|
Irbys27 ·
03-Мар-13 18:20
(спустя 9 мин.)
zlobny_sow
Насколько я знаю, Epson Perfection - планшетный сканер, а Plustek OpticBook - книжный.
|
|
Shassukkum
Стаж: 16 лет 6 месяцев Сообщений: 1178
|
Shassukkum ·
03-Мар-13 18:34
(спустя 14 мин.)
Не хватило у меня денег на Plustek OpticBook.
А на Epson Perfection v33, на данный момент им сканю, особо не жалуюсь.
|
|
|