|
mpv777
 Стаж: 17 лет 5 месяцев Сообщений: 33112
|
mpv777 ·
11-Окт-20 14:07
(4 года 11 месяцев назад)
iptcpudp37 писал(а):
80203922Так почему тогда не упомянуть явно об этом в правилах?
Про заголовки указано, см п.2.2.
|
|
iptcpudp37
Стаж: 15 лет 3 месяца Сообщений: 906
|
iptcpudp37 ·
11-Окт-20 15:18
(спустя 1 час 10 мин.)
mpv777 писал(а):
80204089
iptcpudp37 писал(а):
80203922Так почему тогда не упомянуть явно об этом в правилах?
Про заголовки указано, см п.2.2.
Там явно ничего не сказано о номере издания.
|
|
mpv777
 Стаж: 17 лет 5 месяцев Сообщений: 33112
|
mpv777 ·
11-Окт-20 15:24
(спустя 6 мин.)
iptcpudp37
в примерах есть, но обязательным это не является и не будет таковым.
|
|
iptcpudp37
Стаж: 15 лет 3 месяца Сообщений: 906
|
iptcpudp37 ·
11-Окт-20 16:48
(спустя 1 час 23 мин.)
mpv777 писал(а):
80204455iptcpudp37
в примерах есть, но обязательным это не является и не будет таковым.
Почему нет? Вы считаете номер издания чем-то настолько неважным, что в раздаче ни в заголовке, ни в одном из полей, ни просто в примечаниях об этом не должно упоминаться? Как тогда пользователь узнает, что это именно то издание, которое ему нужно? И как он тогда вообще узнает, что это вообще за издание? Почему сами издатели считают его важным, что даже выносят на обложку и указывают в выходных данных книги, а вы нет?
|
|
rioter11
  Стаж: 18 лет 2 месяца Сообщений: 1648
|
rioter11 ·
11-Окт-20 18:39
(спустя 1 час 51 мин., ред. 11-Окт-20 18:39)
iptcpudp37
Есть ещё много важных моментов для разных категорий книг: переводчик, художник-иллюстратор и т.д, и для кого-то они тоже критично важны, но зачем перегружать шаблон? Если релизер разбирается в теме то он осознаёт важные нюансы оформления конкретных тематических раздач и укажет дополнительно всё что считает значимым. Но порой ценные и редкие книги приходят на трекер от людей не сведущих в тематике - зачем же отпугивать их (и терять важный релиз) подобными подробностями? В поиске по трекеру указание издания особо не поможет, бороться с повторами? - так всегда можно указать что данная книга отличается от уже имеющейся изданием/редакцией.
|
|
Burn in
Стаж: 13 лет 8 месяцев Сообщений: 7700
|
Burn in ·
11-Окт-20 20:38
(спустя 1 час 59 мин.)
iptcpudp37 писал(а):
80204857как он тогда вообще узнает, что это вообще за издание?
Существует год издания. Чем позже год, тем позже издание.
|
|
iptcpudp37
Стаж: 15 лет 3 месяца Сообщений: 906
|
iptcpudp37 ·
12-Окт-20 08:24
(спустя 11 часов)
Burn in писал(а):
80206105
iptcpudp37 писал(а):
80204857как он тогда вообще узнает, что это вообще за издание?
Существует год издания. Чем позже год, тем позже издание.
Нет, вот пример (разные годы, но по факту одно и то же издание):
https://rutr.life/forum/viewtopic.php?t=5225614
https://rutr.life/forum/viewtopic.php?t=5928686
К тому же, если пользователю нужно какое-то определенное издание, то по одному лишь году он не сможет сразу определить какое именно это издание.
|
|
Boris3000
  Стаж: 15 лет 6 месяцев Сообщений: 1105
|
Boris3000 ·
12-Окт-20 09:12
(спустя 47 мин.)
iptcpudp37 писал(а):
80203755
iptcpudp37 писал(а):
80203922Лишние 10 символов в имени файла в такой ситуации особой роли не играет
Вы не в Микрософт, часом, работаете? Девелоперз, девелоперз... При ограничении в 255 символов на ПОЛНОЕ имя файла роль играет каждый символ. Или вы держите все раздаваемые файлы в корне диска С:? Я уже несколько раз ловил неудаляемые файлы после засовывания раздачи в нужный мне путь. Имя файла -- это не база данных.
Однако в целом поддержу вас. Я уже когда-то давно пытался поднять проблему определения до скачивания степени актуальности информации в выкладываемой компьютерной литературе. Только я писал по поводу русскоязычных переводов и года их издания, а не номера издания, но это те же яйца.
Так вот, ещё раз. Когда, наконец, хоть каким-нибудь образом появится возможность узнавать из описания раздачи русского издания компьютерной книги год её исходной рукописи? Который может отличаться от года нашего издания лет на 10 с полной потерей актуальности приведённой в этой книге информации. Неужели не ясно, что для компьютерных книг год русскоязычного издания -- совершенно пустая, ни о чём не говорящая информация? Недавно мне пришлось перекачать все книги по Жабе, а потом сидеть и отбирать актуальные.
Какие проблемы, например, сделать обязательным скрин листа, где все копирайты проставлены? Всё равно ж скрины делать. Хотя скрин -- не лучший вариаант, т. к. все они рано или поздно херятся.
|
|
mpv777
 Стаж: 17 лет 5 месяцев Сообщений: 33112
|
mpv777 ·
12-Окт-20 11:06
(спустя 1 час 53 мин.)
Boris3000 писал(а):
80207906Какие проблемы, например, сделать обязательным скрин листа, где все копирайты проставлены?
Вот сделайте пару сотен раздач книжных, тогда и поймете какие проблемы возникают.
Дальнейшее обсуждение касательно указаний изданий/переизданий считаю лишним, изменений в этом плане не будет.
|
|
Boris3000
  Стаж: 15 лет 6 месяцев Сообщений: 1105
|
Boris3000 ·
12-Окт-20 11:18
(спустя 12 мин.)
mpv777
Чисто из любопытства. Представил, как я 200 раз сканирую лист с копирайтами вместо другого листа, выбираемого от балды. Ничего не понял. Этот лист чем-то особенный?
|
|
mpv777
 Стаж: 17 лет 5 месяцев Сообщений: 33112
|
mpv777 ·
12-Окт-20 12:57
(спустя 1 час 39 мин., ред. 12-Окт-20 12:57)
Boris3000 писал(а):
80208335Этот лист чем-то особенный?
Нет, обычный, но его может и не быть в электронном варианте книги, например. Да и речь не об этом листе, выше коллега правильно отметил:
rioter11 писал(а):
80205462Если релизер разбирается в теме то он осознаёт важные нюансы оформления конкретных тематических раздач и укажет дополнительно всё что считает значимым. Но порой ценные и редкие книги приходят на трекер от людей не сведущих в тематике - зачем же отпугивать их (и терять важный релиз) подобными подробностями?
Да и скачать книжную раздачу не так долго, как правило, чтобы самому всё необходимое посмотреть в файле книги.
Сообщения из этой темы [4 шт.] были выделены в отдельную тему Оффтоп из: Предложения по улучшению категории "Книги и журналы". [119016] mpv777
|
|
Janetza
  Стаж: 16 лет 3 месяца Сообщений: 105
|
Janetza ·
28-Окт-20 00:46
(спустя 15 дней)
Просьба сделать отдельный раздел для Иудаизма.
|
|
Belomorus-2
  Стаж: 9 лет Сообщений: 3409
|
Belomorus-2 ·
28-Окт-20 10:00
(спустя 9 часов)
Janetza писал(а):
80299347Просьба сделать отдельный раздел для Иудаизма.
Ага, с большой буквы.
|
|
ndq
 Стаж: 17 лет 9 месяцев Сообщений: 738
|
ndq ·
14-Янв-21 19:28
(спустя 2 месяца 17 дней, ред. 14-Янв-21 19:28)
Предложение.
Если в сканированной книге (например, формат djvu или pdf) отсутствуют страницы, то ставить такой раздаче статус "сомнительно". А то скачиваешь книгу, с проверенной раздачи, читаешь, а части страниц, оказывается, нету. Обидно. А так сразу ясно, чего ждать.
Кроме того, это будет стимулировать авторов раздач более тщательно проверять, что они выкладывают.
|
|
strash83
  Стаж: 17 лет 11 месяцев Сообщений: 9418
|
strash83 ·
15-Янв-21 04:30
(спустя 9 часов)
ndq писал(а):
80750691Кроме того, это будет стимулировать авторов раздач более тщательно проверять, что они выкладывают.
Ни коим образом не будет, релизиров и так исчезающе мало...
|
|
UberGraf
 Стаж: 16 лет 8 месяцев Сообщений: 77
|
UberGraf ·
15-Июл-21 03:30
(спустя 5 месяцев 30 дней, ред. 15-Июл-21 03:30)
Установить разрешение и вес (занимаемый объём в байтах) для страниц раздаваемой книги сообразно содержимому этих страниц
В настоящий момент категории представлены, но требования отстали лет на десять. Понятно, что остаётся задержка при подгрузке страниц в просмотрщике, но для целиком иллюстрированной книжки предельные значения по весу кажутся драконовскими.
Я вот сканирую сейчас одну детскую книжку, её формата в примерах вообще нет, она 1989 года, что-то близкое к 16:9, такая тонкая брошюрка. Ближайший к ней формат из указанных — это А5 с 500 kB (или всё же KiB?). И я максимум могу позволить ей разрешение 1300 пикселей по горизонтали, чтобы дети не плакали от «джипеговых квадратиков». А между тем разрешение даже дешёвых планшетов уже давно fullHD и выше. И резонно полагать, что люди — как взрослые, так и дети — захотят читать на более широком разрешении, чем позволяет размер страницы. Что увидят? Мыло. А там ведь правда хорошие детальные рисунки (художника Арбекова), есть на что посмотреть. Я бы даже пересканил её заново, максимально ровнее — чтобы лишний раз не вертеть в редакторе, — но с теми правилами трекера, которые действуют сейчас, это просто не нужно, потому что сжатие до 1300 всё смажет. Установить размеры превью сообразно читабельности текста на них (или рассмотрения деталей, в случае, если страница — с изображением)
На превью ( 1, 2, 3) к словарю Даля с трудом можно разобрать мелкий текст. Многие знаки, буквы и целые слова оказываются вообще нечитаемы. Смысл от таких превью? То же касается и постера. Стоит увеличить размер или хотя бы разрешить увеличение размеров превью в 1,5 раза для случаев, когда есть мелкий текст (или мелкие детали на изображениях), когда книга старая и с плохим контрастом, когда либо качество печати либо скана, скажем так, не совсем добротное.
Ведь превью требуются маленькие для чего? Чтобы человек посмотрел их, и понял, удовлетворяет его содержимое раздачи или нет. Если человеку для этой цели приходится выкачивать раздачу, это значит, что превью своей цели не выполняют и являются лишь балластом, их следует заменить на что-то лучшее. Раздачи книги сразу в нескольких форматах пусть указывают оригинальный
Надоело выкачивать раздачу целиком ради одной книги, то в .pdf, то в .djvu, то, в некоторых случаях, в .fb2. Есть оригинальный формат, и он всегда лучший. И это нормально собирать книги только в нём. Когда итальянец в Италии садится в дедушкин Fiat, то он не возит с собой на прицепе ВАЗ «Копейку». И вы не объясните ему, зачем он должен делать это ради людей, которые испытывают отвращение к его фиату и предпочтут сесть только в круглофарник из СССР. (Если сей итальянец вдруг по доброте душевной захочет кого-то подвезти.)
Короче, есть книги в ближайшем к оригиналу виде (но они весят много), есть книги стремящиеся быть близкими (и одновременно удобными для просмотра на более-менее современном компьютере (уже пошёл бы в начальную школу, но ещё не перешёл в среднюю)) и есть узконаправленные переделки, которые в ущерб качеству и близости оригиналу делают возможным чтение на устройствах с малой памятью, малым экраном, малой процессорной мощностью. Это как бы три ветви, класса, и если вы глянете на archive.org, то там нигде не предлагают качать книгу в связке из нескольких типов одновременно. Это же уму непостижимо! Но так как книги первого типа — в полновесных сканах — на трекере практически отсутствуют, то два других и срослись в раздачах, хотя по идее и не должны были.
Предлагаю пока просто помечать в раздачах, который файл — исходник, и насколько прочие ему соответствуют.
|
|
папаВлад
  Стаж: 14 лет 9 месяцев Сообщений: 2671
|
папаВлад ·
15-Июл-21 19:18
(спустя 15 часов)
UberGraf, на данный момент вижу, что Вы уже прошли начальную школу, и уже хотите в среднюю, но не берут из-за нехватки знаний, что-то прогуляли или проболели, лучше бы прогуляли, тогда значит преуспели в другом, например лазил по деревьям и накачал мышцы ) , что тоже неплохо, а недостающие знания можно наверстать позже, или прямо сейчас.
Слово разрешение измеряется в DPI, Вы что-то об этом слышали, но как и зачем оно, здесь пробел, изучите глубже, иначе сейчас делаете неправильные файлы, а пока перед сжатием в пдф перестаньте уменьшать размеры страниц в пикселях, размер файла на выходе вручную регулируйте степенью сжатия, сейчас Ваша программа сжимает в пдф с максимальным качеством, это чрезмерно, получаете в итоге драконовский большой вес, именно с ним и призваны бороться правила.
От Вас требуют научиться регулировать степень сжатия для получения нормального файла, как у всех. Разные программы имеют разные настройки сжатия, беру по файлу Царевна-Змея, там сжатие в JPEG, значит для 300 DPI укажите среднее или высокое качество, либо в процентах 60-80%, такой результат на книге с иллюстрациями впишется в правила, или даже если немного выйдет за пределы, то модератор пропустит, все адекватные. Ещё уменьшить размер файла помогает грамотная чистка от шума (например Topaz Denoise) и/или удаление фона бумаги, нужны знания и желание, потому необязательное требование.
Смотрите на А5 с 500 kB как на рекомендацию, эти цифры не должны никого отпугивать от желания выложить собственную оцифровку книги.
Полезный раздел для новичков и желающих обменяться опытом по оцифровке книг.
Примеры страниц и постер призваны показать примерную начинку книги и не обязаны обеспечивать полную читабельность мелкого текста.
По примерам вполне различимы фотоискажения, наличие лишних полей, почищен или нет фон страниц и прочие моменты, на которые может обратить внимание модератор при оценивании релиза, да и будущий читатель при выборе из нескольких раздач, а если раздача одна, то и выбора не будет. Модераторы по возможности отслеживают и удаляют под поглощение худшие оцифровки, потому зачастую имеется только одна/две актуальные версии, и если книга читателю действительно нужна, то и само наличие превью не важно вообще.
Целиком раздачу выкачивать не обязательно, есть готовая статья Как скачать отдельный файл или найдите свой клиент под любую ось и прочитайте инструкции, либо задайте вопрос по нему.
Про указание оригинала/исходника, извините, но это какой-то детский вопрос из серии "почему зебра полосатая?", я бы растерялся если б меня попросили тут пометить исходник ) , думаю на него правильный ответ и не важен вовсе, просто потрепаться про форматы или старые фиаты есть желание, но не знаете где и с кем, сохраните в закладки этот топик.
И ещё, archive.org всё-таки предлагает "качать книгу в связке из нескольких типов одновременно", кнопка называется SHOW ALL, пример со сказкой Царевна-Змея, уму непостижимо, но факт неоспоримый.
Сообщения из этой темы [1 шт.] были выделены в отдельную тему UberGraf [id: 8255389] (0) mpv777
|
|
mpv777
 Стаж: 17 лет 5 месяцев Сообщений: 33112
|
mpv777 ·
16-Июл-21 16:17
(спустя 20 часов)
UberGraf
Тут воспитанные люди общаются, так что до свидания.
|
|
UberGraf
 Стаж: 16 лет 8 месяцев Сообщений: 77
|
UberGraf ·
16-Июл-21 17:12
(спустя 54 мин.)
Цитата:
Тут воспитанные люди общаются, так что до свидания.
А «до свидания» моему собеседнику вы отправили личным сообщением? А то не вижу такого поста здесь. Да и пост его, несмотря на невоспитанность, почему-то на месте, а мой — удалён, хотя в нём не было ничего, что нарушало бы правила. mpv777, как называется, когда пост выделяют в отдельную тему, а потом удаляют, просто так, без нарушения правил? Тут шла речь о воспитании. А воспитание — это когда люди придерживаются правил… или что-то в этом роде, так?
|
|
mpv777
 Стаж: 17 лет 5 месяцев Сообщений: 33112
|
mpv777 ·
16-Июл-21 17:20
(спустя 8 мин., ред. 16-Июл-21 17:20)
UberGraf писал(а):
81707393хотя в нём не было ничего, что нарушало бы правила.
Хамство и оффтоп были.
UberGraf писал(а):
81707393Да и пост его, несмотря на невоспитанность, почему-то на месте
Там все нормально отвечено, дополню лишь этим:
UberGraf писал(а):
81700837Ведь превью требуются маленькие для чего?
исключительно, чтобы открывать полноразмерные картинки, если необходимо, а не загружать их принудительно.
Или Вы скриншоты "превью" называете ?
|
|
UberGraf
 Стаж: 16 лет 8 месяцев Сообщений: 77
|
UberGraf ·
16-Июл-21 17:51
(спустя 30 мин.)
Цитата:
Хамство и оффтоп были.
Хамство, как нам подсказывает словарь на Академике, это «тип поведения человека, отличающийся резким, грубым и некооперативным способом общения». Моё сообщение было не более резким, чем сообщение того, кому отвечал. Ещё на Академике сказано, что это довольно расплывчатое понятие, и, наверно поэтому, «хамство» не фигурирует в правилах. В них фигурирует «грубость», но в посте не было ни единого грубого слова. Был серьёзный разговор между взрослыми людьми (полагаю, человек со стажем в десять лет на трекере и с лычкой TopSeed давно уже взрослый). Была приветливость и искреннее беспокойство за здоровье соотечественника.
Что касается оффтопа: если высказывания папаВлад’а про начальную школу, про советы не в тему и его же реклама топиков для флуда не считается за оффтоп — и даже имеет право удерживаться в теме, — то я боюсь предположить, что тогда оффтоп. Сообщения как раз по теме, что ли? (Шутка.)
Цитата:
Или Вы скриншоты "превью" называете ?
Хм-м. Полагаю, для продолжения дискуссии на трекере стоит сначала устаканить определения для «оригинала страницы», «крупного превью» и «малого», которое иконка для превью… Иначе это будет разговор слепого с глухим.
Ну и довольно слов, где дело? Пост вернут? Правила откроют? Если мне тут не рады из-за личной неприязни, то я пойду Мошкову книги отдам. Или на imwerden. А тут я ухожу с раздач и au revoir.
|
|
mpv777
 Стаж: 17 лет 5 месяцев Сообщений: 33112
|
mpv777 ·
16-Июл-21 17:58
(спустя 7 мин.)
UberGraf писал(а):
81707569Полагаю, для продолжения дискуссии на трекере стоит сначала устаканить определения для «оригинала страницы», «крупного превью» и «малого», которое иконка для превью…
Всё давно установлено, не нужно ничего изобретать: есть "Примеры страниц (скриншоты)", для которых регламентированы допустимые диапазоны размеров, позволяющие оценить материал до скачивания. В раздачах они оформляются в виде "превью", для которого также есть ограничения.
UberGraf писал(а):
81707569Пост вернут?
Нет.
|
|
папаВлад
  Стаж: 14 лет 9 месяцев Сообщений: 2671
|
папаВлад ·
16-Июл-21 22:57
(спустя 4 часа)
UberGraf, меня днём не было, напишите в ЛС все свои претензии, почитаю.
Если имеете интерес к обучению, то помогу, чем могу, если пришли мешать и капризничать, то и для потрепаться топики есть на рутрекере, там Вас ждут.
Переспите ночь, потом пишите, утро вечера мудренее.
|
|
iptcpudp37
Стаж: 15 лет 3 месяца Сообщений: 906
|
iptcpudp37 ·
07-Авг-21 15:09
(спустя 21 день)
Предлагаю подкорректировать правила оформления раздач в разделе, а именно сделать указание оглавления издания обязательным, а не просто рекомендуемым, как сейчас.
|
|
krauzer7770
 Стаж: 14 лет 3 месяца Сообщений: 486
|
krauzer7770 ·
10-Сен-21 18:28
(спустя 1 месяц 3 дня)
Попытаюсь внести свое предложение. Так как формат PDF все таки является на данный момент намного более распространен и более популярнее чем формат DJVU, предлагаю, если сканировщик выкладывает в формате DJVU, то он обязан выложить этот же файл и в формате PDF. В формате DJVU есть много минусов, особенно с текстовым слоем. Если например скопировать текстовый слой в Word, то в Worde текстовый слой будет перенесен построчно. А это большой минус. То есть всё форматирование коту под хвост. По этой же причине в DJVU нельзя найти слово которое перенесено на другую строку. Потому что не получается цельного слова. А в ПДФ как вы оттуда скопируете например абзац, так он в Worde и останется в виде абзаца. То есть смысл "распознавания текста" в DJVU полностью сводится на нет.
|
|
ndq
 Стаж: 17 лет 9 месяцев Сообщений: 738
|
ndq ·
10-Сен-21 19:12
(спустя 44 мин., ред. 10-Сен-21 19:12)
Предлагаю это предложение отклонить. Если вам нужен pdf - делайте его сами и выкладывайте на здоровье.
Про проблемы с текстовым слоем - неправда. Делаю его в Файнридере, никаких проблем с переносом слов и соответственно с поиском нет. Просто делать надо правильно. Правда, я еще потом пользуюсь утилитой DjVu Text Layer Crutch, может это она исправляет. 
В любом случае, это не проблема формата djvu, а проблема (если она вообще есть) программ-распознавателей и кривых рук обработчиков.
|
|
petoleg
 Стаж: 18 лет 4 месяца Сообщений: 725
|
petoleg ·
10-Сен-21 19:15
(спустя 2 мин.)
krauzer7770 писал(а):
81959775Попытаюсь внести свое предложение. Так как формат PDF все таки является на данный момент намного более распространен и более популярнее чем формат DJVU, предлагаю, если сканировщик выкладывает в формате DJVU, то он обязан выложить этот же файл и в формате PDF. В формате DJVU есть много минусов, особенно с текстовым слоем. Если например скопировать текстовый слой в Word, то в Worde текстовый слой будет перенесен построчно. А это большой минус. То есть всё форматирование коту под хвост. По этой же причине в DJVU нельзя найти слово которое перенесено на другую строку. Потому что не получается цельного слова. А в ПДФ как вы оттуда скопируете например абзац, так он в Worde и останется в виде абзаца. То есть смысл "распознавания текста" в DJVU полностью сводится на нет.
Все зависит от PDF. Может абзац как абзац, может будут разбиты на строчки, может быть разбивка по словам или каждая строчка из одной буквы.
Обязан выложить PDF, я могу послать того кто это меня обяжет... Сейчас трудоемкость сделать что-бы PDF был сделан качественно, намного больше чем сделать Djvu...
|
|
krauzer7770
 Стаж: 14 лет 3 месяца Сообщений: 486
|
krauzer7770 ·
10-Сен-21 22:28
(спустя 3 часа)
ndq писал(а):
81959943Предлагаю это предложение отклонить. Если вам нужен pdf - делайте его сами и выкладывайте на здоровье.
Про проблемы с текстовым слоем - неправда. Делаю его в Файнридере, никаких проблем с переносом слов и соответственно с поиском нет. Просто делать надо правильно. Правда, я еще потом пользуюсь утилитой DjVu Text Layer Crutch, может это она исправляет. 
В любом случае, это не проблема формата djvu, а проблема (если она вообще есть) программ-распознавателей и кривых рук обработчиков. 
Беру для примера Ваш же файл "Ежегодник Большой советской энциклопедии (выпуск 1)". Вбиваю в открытом файле в поиск фамилию Чубинидзе и на стр.8 где эта фамилия присутствует, поиск его не находит. Именно потому, что на этой странице это слово идет с переносом на другую строку. Т.е. пользы от этого распознанного слоя буквально ноль. Если бы это был PDF формат, слово бы нашлось. Т.е. в справочнике или энциклопедии если нужно найти определенное слово, DjVu может оказаться абсолютно бесполезным, а PDF бы справился бы на все 100%. Например если нужно делать презентацию и нужно скопировать очень большой по объему текст из книги, то скопировав например из PDF, Вы затратите минимум времени по его доработке и форматированию. А если скопировать текст из того же DjVu, то придется все переносы строк убирать вручную!!! А это в десятки раз увеличивает время на оформление. Поэтому формат PDF и стал передовым форматом во всем мире.
|
|
ndq
 Стаж: 17 лет 9 месяцев Сообщений: 738
|
ndq ·
11-Сен-21 09:51
(спустя 11 часов, ред. 11-Сен-21 09:51)
krauzer7770
Это был мой один из первых файлов. Djvu тут ни при чем - если бы я тогда делал pdf, он был бы такой же. Я его переделаю в свое время.
|
|
petoleg
 Стаж: 18 лет 4 месяца Сообщений: 725
|
petoleg ·
11-Сен-21 22:33
(спустя 12 часов, ред. 11-Сен-21 22:33)
krauzer7770 писал(а):
81960866
ndq писал(а):
81959943Предлагаю это предложение отклонить. Если вам нужен pdf - делайте его сами и выкладывайте на здоровье.
Про проблемы с текстовым слоем - неправда. Делаю его в Файнридере, никаких проблем с переносом слов и соответственно с поиском нет. Просто делать надо правильно. Правда, я еще потом пользуюсь утилитой DjVu Text Layer Crutch, может это она исправляет. 
В любом случае, это не проблема формата djvu, а проблема (если она вообще есть) программ-распознавателей и кривых рук обработчиков. 
Беру для примера Ваш же файл "Ежегодник Большой советской энциклопедии (выпуск 1)". Вбиваю в открытом файле в поиск фамилию Чубинидзе и на стр.8 где эта фамилия присутствует, поиск его не находит. Именно потому, что на этой странице это слово идет с переносом на другую строку. Т.е. пользы от этого распознанного слоя буквально ноль. Если бы это был PDF формат, слово бы нашлось. Т.е. в справочнике или энциклопедии если нужно найти определенное слово, DjVu может оказаться абсолютно бесполезным, а PDF бы справился бы на все 100%. Например если нужно делать презентацию и нужно скопировать очень большой по объему текст из книги, то скопировав например из PDF, Вы затратите минимум времени по его доработке и форматированию. А если скопировать текст из того же DjVu, то придется все переносы строк убирать вручную!!! А это в десятки раз увеличивает время на оформление. Поэтому формат PDF и стал передовым форматом во всем мире.
Начнем с того есть ли в файле текстовый слой или нет и что нет защиты от копирования этого слоя. Что для PDF, что для Djvu без разницы...
См. https://rutr.life/forum/viewtopic.php?t=5347971 - PDF без текстового слоя и https://rutr.life/forum/viewtopic.php?t=5351362 Djvu с текстовым слоем.
Текстовый слой вычитывался? Если нет (да и если да, но пропустили ошибку в этом слове) или использовались программы для автоматической коррекции текста, то можете вместо Чубинидзе получить типа Чуб ниже. И желательно вычитывать трижды...
А надо (ошибки OCR помечены):
скрытый текст
Цитата:
Состав Президиума Верховного Совета СССР:
председатель — К. Е. Ворошилов, 1G
заместителей (М. П. Тарасов, Д. С. Коротченко, В. И.
Козлов, III. Р. Рашидов, Н. Д. Ундасынов, М. Д. Чуби-
нидзе, М. А. Ибрагимов, Ю. И. Палецкис, И. С. Ко-
дица, К. М. Озолинь, Т. Кулатов, Н. Додхудоев,
Ш. М. Арушанян, А. Сарыев, А. М. Якобсон,
¬О. В. Куусинен), секретарь (с 12 февраля
1957 г. — М. П. Георгадзе), 15 членов (А. А.
Андреев, Т. И. Архипова, В. С. Балакина, В. Р. Боя-
нова, С. М. Буденный, А. Д. Даниилов, И. В.
Капитонов, А. И. Кириченко, Ф. Р. Козлов,
¬3. И. Муратов, 3. Н. Нуриев, А. М. Панкратова,
¬II. К. Пономаренко, Н. С. Хрущев, Н. М. Шверник).
ЗЫ если собираетесь что-то искать в документах - купите Архивариус.
ЗЫ2 склеивать тексты после OCR - возьмите Иероглиф.
|
|
|