При копировании из PDF в текстовый редактор текст размещается не по всей странице

Страницы:  1
Ответить
 

KOMANDIR1111

Top Seed 02* 80r

Стаж: 15 лет 5 месяцев

Сообщений: 1453

KOMANDIR1111 · 10-Апр-13 17:29 (11 лет 9 месяцев назад)

Помогите пожалуйста разобраться.
Нашел pdf (с распознанным текстом) c интересной книжкой. Решил сделать fb2. До этого уже справлялся с такой процедурой. Сначала копировал распознанный текст в OpenOffice, затем уже с помощью OOoFBTools размечал и конвертировал в fb2.
Но вот попался pdf, с крупным шрифтом. И после копирования в OpenOffice сохраняется исходная длина строки, т.е. на листе заполнена только левая половина.
А когда конвертирую в fb2, то никакой разбивки по абзацам. Можно ли такую разбивку сделать автоматически? Или нужно делать вручную (del в конце строки и enter перед абзацем)?
[Профиль]  [ЛС] 

evgeniy27ib

Стаж: 12 лет

Сообщений: 2


evgeniy27ib · 10-Апр-13 18:46 (спустя 1 час 17 мин.)

Попробуй через замену не печатных знаков.
[Профиль]  [ЛС] 

KOMANDIR1111

Top Seed 02* 80r

Стаж: 15 лет 5 месяцев

Сообщений: 1453

KOMANDIR1111 · 10-Апр-13 20:41 (спустя 1 час 55 мин., ред. 11-Апр-13 19:50)

Интересный способ. Я попробовал заменять знак абзаца на "ничто". Получилось. Но тут другая проблема - многие строки с переносом в конце, и такая замена создает много слов с дефисом внутри.
Если делать замену по очереди - сначала "дефис+знак абзаца", а потом просто "знак абзаца", то работы получается меньше. Но все равно неприятно - появляются слова вроде "какоето", а между предложениями исчезает пробел.
Есть ли способ уменьшить объем работы? Распознавание каким-нибудь файнридером оставит меньше работы, или больше?
Я уверен, что с такой проблемой уже сталкивались.
Можно, конечно, и на этом остановиться, а потом все выправить вручную, но это уж слишком муторно.
Ладно, это решилось - просто я взял программку, которая переводит текст в файл ворда. Но теперь другая проблемка - есть ли такая программа, у которой можно исключить из анализируемой области верхний колонтитул? Т.е. для всех страниц настроить одну область? А то из текста придется вручную названия главы удалять.
[Профиль]  [ЛС] 

knigniks

Стаж: 12 лет 2 месяца

Сообщений: 17


knigniks · 13-Апр-13 12:51 (спустя 2 дня 16 часов)

Я обычно перевожу в текст такие файлы Файнридером 11
проблемы минимальные
и желательно проверять на ошибке, в том же Файн ридере
[Профиль]  [ЛС] 

KOMANDIR1111

Top Seed 02* 80r

Стаж: 15 лет 5 месяцев

Сообщений: 1453

KOMANDIR1111 · 13-Апр-13 22:10 (спустя 9 часов)

Спасибо, уже ручками все сделал(
В OOoFBTools оказывается есть инструментарий для склеивания абзацей, висячих строк и т.д.
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error