|
aa666
Стаж: 17 лет 10 месяцев Сообщений: 412
|
aa666 ·
05-Апр-13 23:22
(11 лет 7 месяцев назад)
|
|
VerenaB
Стаж: 14 лет 2 месяца Сообщений: 251
|
VerenaB ·
06-Апр-13 01:30
(спустя 2 часа 7 мин.)
DjVu-Master
Очень хорошая тема, спасибо!
Тоже, давно пользуюсь ScanTailor и хотел бы высказать свое мнение. Может быть я буду не прав, но в разделе "Обработка сырых сканов" в подразделе "Вывод" Вы предлагаете сразу же выставить для всех страниц 300 DPI.
Я, например, выставляю 300 DPI, только, для режима цветной/серый. Для режимов черно-белый и смешанный оставляю 600 DPI (по умолчанию). Дело в том, что в этом режиме текст, практически не искажается (нет рваных и резаных букв), как при 300 DPI, что дает, в дальнейшем, возможность оптимизировать полученный материал без значительных потерь, например в AdobeAcrobat. Поверьте, никому не навязываю свое мнение (ИМХО).
Примеры страниц до и после обработки для режима смешанный под спойлером.
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
06-Апр-13 01:56
(спустя 25 мин., ред. 06-Апр-13 01:56)
VerenaB писал(а):
58720167Вы предлагаете сразу же выставить для всех страниц 300 DPI.
Я так делаю. Мне хватает. Ваше право выводить 300 в 600.
VerenaB писал(а):
58720167Примеры страниц до и после обработки для режима смешанный под спойлером.
Разница на глаз не велика. А вот в размере разница вылезет нормальная.
Для большинства книг 300 хватает. Там где мелкий текст - 600 нужно.
Я так считаю отсканил в 300 то и выводи в 300, 600 то 600.
Еще как вариант при 400 сканить. Не много и не мало.
А самый лучший вариант это распознать всю книгу.
VerenaB писал(а):
58720167Очень хорошая тема, спасибо!
Пришлось написать. Я просто замучался тоже самое в ЛС писать. Каждый раз все от руки. И каждый раз скрины новые снимал.
Я вот ваши раздачи посмотрел.. И первый вопрос - почему в ПДФ пакуете?
|
|
VerenaB
Стаж: 14 лет 2 месяца Сообщений: 251
|
VerenaB ·
06-Апр-13 02:46
(спустя 50 мин.)
DjVu-Master писал(а):
58720248Разница на глаз не велика. А вот в размере разница вылезет нормальная.
Совершенно с Вами согласен, размер результирующего файла раза в 2,5 больше. Но для PDF я подобрал режим оптимизации, при котором, практически, не заметно сжатие и размер после оптимизации не такой уж и большой.
DjVu-Master писал(а):
58720248Еще как вариант при 400 сканить. Не много и не мало.
Тоже, как вариант, надо попробовать
DjVu-Master писал(а):
58720248А самый лучший вариант это распознать всю книгу.
Понимаете, я в основном сканирую справочники и хочу показать людям, как они выглядят в оригинале, а именно сигнатуру шрифта.
В FineReader очень сложно подбирать шрифт для справочников советских времен, так как многие шрифты не были оцифрованы, за исключением небольшого количества в ParaType.
Но все же, некоторые издания мне приходится прогонять через FineReader с подборкой шрифта, так как они очень старые и потрепанные и обработке в ScanTailor не подлежат. Я думаю, Вы представляете о чем я говорю.
DjVu-Master писал(а):
58720248Я вот ваши раздачи посмотрел.. И первый вопрос - почему в ПДФ пакуете?
Вы посмотрели не все мои раздачи. Самые первые из них я делал в двух вариантах, DjVu и PDF.
Отбросил DjVu, потому что возни, значительно, больше. Но не спорю, что качество документа в DjVu выше и размер результирующего файла, значительно меньше.
Ну что поделаешь, лентяй я
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
06-Апр-13 11:21
(спустя 8 часов)
VerenaB писал(а):
58720512Я думаю, Вы представляете о чем я говорю.
VerenaB писал(а):
58720512Но не спорю, что качество документа в DjVu выше и размер результирующего файла, значительно меньше.
VerenaB писал(а):
58720512Отбросил DjVu, потому что возни, значительно, больше.
VerenaB писал(а):
58720512Ну что поделаешь, лентяй я
|
|
aa666
Стаж: 17 лет 10 месяцев Сообщений: 412
|
aa666 ·
06-Апр-13 12:45
(спустя 1 час 23 мин.)
yuree писал(а):
58718754Или Вы хотите сказать что в DjVu нельзя повторить такой же финт с латиницей и арабским? Насколько я знаю, нельзя.
в djvu оно (быстрый переход к произвольной странице по номеру) таки делается, через индекс
а по "v" в англоязычном документе сами ищите
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
06-Апр-13 18:19
(спустя 5 часов)
aa666 писал(а):
58724808
yuree писал(а):
58718754Или Вы хотите сказать что в DjVu нельзя повторить такой же финт с латиницей и арабским? Насколько я знаю, нельзя.
в djvu оно (быстрый переход к произвольной странице по номеру) таки делается, через индекс
По поводу номера кто-то спорит?
Можете в DjVu поиск и по латинскому и по арабскому номеру страницы сделать переход и если да то в каком вьювере?))
Цитата:
а по "v" в англоязычном документе сами ищите
Спасибо, у меня и без этих приколов работы уйма.
скрытый текст
Сканировать и оцифровать учебник с середины, что-бы им ребёнок пользовался, всё равно что показать ему "Маугли" только с 12-й по 20-ю минуту, или сказку рассказать, кусок с середины. Впрочем, в каждой избушке ...
|
|
kenmeina
Стаж: 15 лет 3 месяца Сообщений: 417
|
kenmeina ·
07-Апр-13 16:53
(спустя 22 часа)
Здравствуйте, уважаемые! Помогите советом.
Поменял WinXP на Win7(x64), следовательно заменил (скачал с оф.сайта) драйвер для сканера HP Scanjet 3800. И не могу продолжить нормально сканировать книги - после выставления настроек (яркость и т.п. - для тонких просвечивающих страниц, например) и сканирования первой страницы, приходится для следующей всё делать заново - драйвер предлагает либо закончить сканирование, либо продолжить, после чего сбрасываются все настройки и запускается предварительное сканирование. Раньше (на этом и других сканерах) запускал предварительное сканирование, выставлял нужные параметры и оставалось только класть на стекло новую страницу и кликать по кнопке "Сканировать"
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
07-Апр-13 17:17
(спустя 24 мин.)
kenmeina
Попробуйте через IrfanView. Почитайте как, под спойлером 1. Сканирование книги. Или вернитесь на ХР.
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
07-Апр-13 19:32
(спустя 2 часа 15 мин.)
DjVu-Master
Надо, где-то между пунктами, втиснуть в твоём уроке что-бы люди растр саттвой давили, полезное дополнение. Как считаешь?
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
07-Апр-13 19:34
(спустя 1 мин.)
yuree
Допишем еще много чего. Я просто сейчас занят другим. Хочешь напиши код - я вставлю.
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
07-Апр-13 20:48
(спустя 1 час 13 мин.)
Как не парадоксально но я тоже сейчас много чем занят)
Может, с недели.
|
|
Irbys27
Стаж: 14 лет 9 месяцев Сообщений: 2428
|
Irbys27 ·
08-Апр-13 17:12
(спустя 20 часов)
Можно ли как-нибудь удалить типографские ляпы с этой страницы, что бы потом сохранить в формате Djvu?
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
08-Апр-13 17:25
(спустя 13 мин., ред. 08-Апр-13 17:25)
Arlandok
Да, можно. На стадии вывода, инструментом заливка повыводить-позаливать буквы.
Еще вариант вывести скан в режиме цветной/серый и распознать его. Но тут шрифт "древне-китайский"... Скиньте оригинал не обработанный.
|
|
Irbys27
Стаж: 14 лет 9 месяцев Сообщений: 2428
|
Irbys27 ·
08-Апр-13 17:47
(спустя 21 мин.)
DjVu-Master
Отправил в личку.
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
08-Апр-13 18:09
(спустя 21 мин.)
Arlandok
Для начала отсканьте без засветов.
|
|
Irbys27
Стаж: 14 лет 9 месяцев Сообщений: 2428
|
Irbys27 ·
08-Апр-13 19:59
(спустя 1 час 50 мин.)
DjVu-Master писал(а):
58764457Arlandok
Для начала отсканьте без засветов.
Не получится, книга очень старая, а сканер у меня далеко не книжный.
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
08-Апр-13 20:01
(спустя 1 мин.)
Arlandok писал(а):
58766329Не получится, книга очень старая, а сканер у меня далеко не книжный.
Вы что не можете нормально ее прижать? У меня тоже обычный сканер. Mustek Be@rPaw 2448CU Pro
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
08-Апр-13 20:50
(спустя 49 мин.)
Arlandok
Можно книги(-у) сверху положить на половинки(-у) страниц(-ы).
Дело хлопотное, сам знаю ... или меняйте на CCD-шный.
DjVu-Master писал(а):
58766347Mustek Be@rPaw 2448CU Pro
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
08-Апр-13 21:08
(спустя 18 мин.)
yuree
У меня опера я не вижу картинки
.
На фастпик залей.
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
08-Апр-13 22:30
(спустя 1 час 22 мин.)
DjVu-Master писал(а):
58767666<...>
На фастпик залей.
Смысл тот-же → здесь
скрытый текст
У меня тоже Опера, обновил недавно.
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
09-Апр-13 01:43
(спустя 3 часа, ред. 11-Апр-13 18:04)
yuree Ты читал какие-то отзывы про мой сканер?
|
|
Гость
|
Гость ·
15-Апр-13 15:56
(спустя 6 дней, ред. 15-Апр-13 15:56)
А по-моему, как необязательно выкладывать и оцифровывать книги в формате pdf, djvu и прочая , так книжные торренты качественнее и более трудоемкие, если сделаны в формате doc .
Но за выкладку информации, спасибо, .
|
|
rioter11
Стаж: 17 лет 4 месяца Сообщений: 1654
|
rioter11 ·
15-Апр-13 18:10
(спустя 2 часа 13 мин.)
Цитата:
А по-моему, как необязательно выкладывать и оцифровывать книги в формате pdf, djvu и прочая , так книжные торренты качественнее и более трудоемкие, если сделаны в формате doc
ooops... поясните Вашу мысль пожалуйста??
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
15-Апр-13 19:42
(спустя 1 час 31 мин.)
DjVu-Master писал(а):
58771428yuree Ты читал какие-то отзывы про мой сканер?
Прости — запамятовал.
Повтори марку.
скрытый текст
если у тебя CIS'ка то можно и не читать) тот ещё гемор
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
15-Апр-13 20:21
(спустя 39 мин., ред. 16-Апр-13 00:07)
rioter11 писал(а):
58873189поясните Вашу мысль пожалуйста??
Человек про то, что больше труда уходит на распознавание текста. Alexandr0000
Вот тоже самое. Только вместо .doc сохранено в .djvu.
yuree писал(а):
58874765Повтори марку.
Mustek Be@rPaw 2448CU Pro
Цитата:
если у тебя CIS'ка
А где прочитать?
|
|
Shassukkum
Стаж: 15 лет 8 месяцев Сообщений: 1179
|
Shassukkum ·
15-Апр-13 22:23
(спустя 2 часа 1 мин.)
DjVu-Master писал(а):
58875407
Цитата:
если у тебя CIS'ка
А где прочитать?
Нунапример здесь:
И ещё по теме, если не видел → https://rutr.life/forum/viewtopic.php?p=55467951#55467951
А о том почему CCD а не CIS надо выбирать → Наглядное сравнение сканеров CCD и CIS при сканировании книг
... кто не в курсе.
ПС. Нашёл вот, если кто определиться хочет с покупкой → тыць
|
|
$Shorox
Стаж: 15 лет 9 месяцев Сообщений: 1673
|
$Shorox ·
13-Июл-13 13:17
(спустя 2 месяца 27 дней)
DjVu-Master,
Вопрос такой: Как сделать книгу в DjVu с "Распознанный текст без ошибок (OCR)"
Как сделать книгу в PDF с "Распознанный текст без ошибок (OCR)" я знаю. С DjVu не могу понять.
|
|
DjVu-Master
Стаж: 14 лет 10 месяцев Сообщений: 6109
|
DjVu-Master ·
13-Июл-13 13:34
(спустя 17 мин., ред. 13-Июл-13 13:34)
$Shorox
$Shorox писал(а):
60077187Как сделать книгу в PDF с "Распознанный текст без ошибок (OCR)" я знаю. С DjVu не могу понять.
Так само и с ДжВю.
|
|
$Shorox
Стаж: 15 лет 9 месяцев Сообщений: 1673
|
$Shorox ·
13-Июл-13 13:40
(спустя 5 мин.)
DjVu-Master
Что-то я всё равно не понял.
Сейчас я делаю вот так:
Схема создания книги DjVu
ScanTailor - выравниваем страницы и и так далее..
ST Split - отделяем текст от картинок.
DjVu Small - кодируем текст.
Adobe Photoshop - обработка картинок.
DjVu Imager - вклеиваем картинки. Получаю Djvu (без OCR-слоя).
ABBYY FineReader - создание (из неразделённых сканов) книги в формате DjVu с OCR-слоем.
DjvuOCR - извлечение из неё OCR-слоя и добавление в Djvu (без OCR-слоя)
HandyOutliner for DjVu-PD - создание оглавления.
Книга готова.
В этом варианте получается "Отсканированные страницы + слой распознанного текста".
Мне надо сделать DjVu с "Распознанный текст без ошибок (OCR)"
|
|
|