|
DjVu-Master
Стаж: 15 лет 1 месяц Сообщений: 6135
|
DjVu-Master ·
14-Окт-11 23:45
(13 лет 3 месяца назад, ред. 14-Окт-11 23:47)
По-моему книгам у которых Качество: OCR с ошибками, нужно ставить Статус: # сомнительно.
Ведь если есть ошибки - значит содержимое не соответствует оригиналу.
За что Статус: √ проверено? За ошибки которые наделал FR? Хочу услышать ваше мнение.
|
|
Cucumis
Стаж: 17 лет 6 месяцев Сообщений: 12002
|
Cucumis ·
15-Окт-11 12:01
(спустя 12 часов)
Stepanenko.P.V.
Можно примеры таких раздач?
|
|
DjVu-Master
Стаж: 15 лет 1 месяц Сообщений: 6135
|
DjVu-Master ·
15-Окт-11 12:13
(спустя 12 мин.)
|
|
Cucumis
Стаж: 17 лет 6 месяцев Сообщений: 12002
|
Cucumis ·
15-Окт-11 12:16
(спустя 3 мин.)
Stepanenko.P.V. писал(а):
[Психиатрия] Пашковский В.Э. - Психические расстройства с религиозно-мистическими переживаниями [2006, DjVu, RUS]
Тут OCR - это текстовый слой поверх скана. Скан ведь соответствует оригиналу, его вообще без OCR можно раздавать (и будет "проверено") Сейчас такое качество для большей понятности называем в шаблоне "отсканированные страниц + слой распознанного текста".
|
|
malshin
Стаж: 17 лет 3 месяца Сообщений: 1256
|
malshin ·
15-Окт-11 12:19
(спустя 2 мин.)
Статус проверено ставится при полном соответствии проверяемой раздачи действующим на момент проверки правилам трекера по оформлению раздач в книжном разделе, а отнюдь не качеству проведенного OCR.
Теоретически в любом печатном издании могли/могут быть ошибки (недосмотр корректоров и редакторов при подготовке издания), соответственно и в отсканированном, распознанном и вычитанном издании тоже могут быть ошибки, допущенные тем, кто вычитывает (никто от них не застрахован, все мы живые люди и способны ошибаться) - и вы предлагаете из-за малейшей такой неточности при вычитке подвергать сомнению колоссальную работу вычитывающего?
Большое число отсканированных книг, распространяемых в рунете, вообще никогда не подвергалось вычитке (этот процесс не сопоставим по затратам времени с самим сканированием и OCR, он гораздо затратнее - если бы все книги подвергать вычитке по установленным жестким правилам, да еще с дополнительной проверкой вычитки сторонними людьми, то книг релизилось бы тогда в сотни раз меньше, да и желания сканировать их заметно поубавилось бы у релизеров) ...
Кроме того замечу, что проведенный "OCR с ошибками" в основном нужен лишь для быстрого поиска нужного места с нужной информацией в оцифрованном издании (при условии, что оригинальный скан сохранен, а не сделан полный e-book). Также для распознавания используют не только ФР, но и другие программы (я лично, например, использую Акробат Про).
|
|
DjVu-Master
Стаж: 15 лет 1 месяц Сообщений: 6135
|
DjVu-Master ·
15-Окт-11 12:33
(спустя 13 мин., ред. 15-Окт-11 12:33)
Cucumis писал(а):
"отсканированные страницы + слой распознанного текста"
К такому качеству у меня претензий нет.
malshin писал(а):
распознанном и вычитанном издании тоже могут быть ошибки, допущенные тем, кто вычитывает (никто от них не застрахован, все мы живые люди и способны ошибаться)
Я вычитую без ошибок. Могу просидеть часов 5-ть подряд.
Цитата:
то книг релизилось бы тогда в сотни раз меньше,
Почему? Статус: # сомнительно и пускай живет.
malshin писал(а):
да и желания сканировать их заметно поубавилось бы у релизеров
Почему? Отсканил. Запаковал И выкладывай в качестве отсканированные страницы
malshin писал(а):
Также для распознавания используют не только ФР, но и другие программы (я лично, например, использую Акробат Про).
Да все равно чем.
З.Ы. Я против касечтва отсканированные страницы + слой распознанного текста (с ошибками или без) ничего не имею.
|
|
Cucumis
Стаж: 17 лет 6 месяцев Сообщений: 12002
|
Cucumis ·
15-Окт-11 12:48
(спустя 15 мин., ред. 15-Окт-11 12:48)
Stepanenko.P.V. писал(а):
Я против касечтва отсканированные страницы + слой распознанного текста (с ошибками или без) ничего не имею.
А другое (только текст с ошибками, то есть совсем не вычитанный) бывает крайне редко. И в таком случае можно как # поставить, так и вообще закрыть (если одни ошибки кругом и читать невозможно).
|
|
DjVu-Master
Стаж: 15 лет 1 месяц Сообщений: 6135
|
DjVu-Master ·
15-Окт-11 12:54
(спустя 6 мин., ред. 15-Окт-11 12:54)
Cucumis писал(а):
то есть совсем не вычитанный
Да, я его имел в виду.
Типа распознал FR без проверки, закинул в .DOC или сохранил в PDF и сюда.
|
|
malshin
Стаж: 17 лет 3 месяца Сообщений: 1256
|
malshin ·
15-Окт-11 14:22
(спустя 1 час 27 мин., ред. 15-Окт-11 14:22)
Цитата:
Я вычитую без ошибок
Пусть у вас без ошибок. А 100% гарантию вашей вычитки кто может дать? Вы сами? Только те, кто проверил ее после вас от начала и до конца ...
Цитата:
Статус: # сомнительно и пускай живет.
Вот именно поэтому, что "сомнительно", это не способствует у многих релизеров желания дальше релизить что-нибудь на трекере (я умолчу о всяких лычках и пр. атрибутах)
Цитата:
Почему? Отсканил. Запаковал И выкладывай в качестве отсканированные страницы
Да все по тому же. Если размер скана превышает разрешенные в правилах книжного размера при высоком качестве сканирования? У меня так очень часто выходит (можно сказать, что почти всегда) и только распознавание без вычитки позволяет снизить размер сканов. При таких ваших условиях, будь они узаконены в правилах раздела, у меня лично пропадет всякое желание выкладывать здесь что-нибудь новое, и я просто "утеку" на другой трекер, где не будет таких жестких правил ...
Цитата:
Я против качества отсканированные страницы + слой распознанного текста (с ошибками или без) ничего не имею
Так об этом и надо было бы сразу писать, что вы имеете в виду чисто "Типа распознал FR без проверки, закинул в .DOC или сохранил в PDF", т.е. без сохранения исходного скана, а то я сразу не въехал в тему ... потому что для меня нет разницы между "OCR с ошибками" и "сканированные страницы + слой распознанного текста (с ошибками)" при наличии оригинального скана ...
|
|
DjVu-Master
Стаж: 15 лет 1 месяц Сообщений: 6135
|
DjVu-Master ·
15-Окт-11 15:13
(спустя 51 мин., ред. 15-Окт-11 15:13)
malshin писал(а):
Пусть у вас без ошибок. А 100% гарантию вашей вычитки кто может дать? Вы сами? Только те, кто проверил ее после вас от начала и до конца ...
Я даю вам 100% гарантию вычитки этой книги.
Мир Животных - Акимушкин И.И. - Птицы. Рыбы, земноводные и пресмыкающиеся (Издание третье) [1995, DjVu, RUS] Обновлено 22.09.2011г.
Особенности формата DjVu не в счет, ОК? Просто после конверта из PDF в DjVu, некоторые символы не отображаются. Типо тире в ISBN.
Должно быть так
а вот скопированый текст из книги
З.Ы. Если бы эта тема была затронута раньше то я бы вам отправил бы проэкты из FR. А так как они занимали много места (до 1.5 Гб) я их удалил.
|
|
malshin
Стаж: 17 лет 3 месяца Сообщений: 1256
|
malshin ·
15-Окт-11 15:52
(спустя 39 мин.)
Цитата:
Я даю вам 100% гарантию вычитки этой книги.
вообще-то такую гарантию может дать только совершенно стороннее и никак не заинтересованное в этом лицо (например любой скачавший и проверивший вычитку), но никак не сам релизер, вот что я имел в виду.
В качестве придирки - ваша цитата в начале темы "Ведь если есть ошибки - значит содержимое не соответствует оригиналу." и если бы у вас в указанной раздаче не были бы сохранены исходные сканы, а была бы чистая конвертация распознанного текста, то ваше признание с отсутствием даже просто тире в номере (причем неважно в каком формате) было бы уже основанием (по вашему же предложению) не присвоить вашей раздаче статуса "проверено", поскольку "содержимое не соответствует оригиналу"
Так что действительно, если исходного скана вместе со слоем распознанного текста в раздаче нет (по которому можно провести сверку распознанного), а есть только тупо выдернутый из сканов невычитанный текст, то согласен с мнением модератора "И в таком случае можно как # поставить, так и вообще закрыть (если одни ошибки кругом и читать невозможно)."
|
|
DjVu-Master
Стаж: 15 лет 1 месяц Сообщений: 6135
|
DjVu-Master ·
15-Окт-11 17:34
(спустя 1 час 42 мин., ред. 15-Окт-11 17:34)
malshin писал(а):
то ваше признание с отсутствием даже просто тире в номере (причем неважно в каком формате) было бы уже основанием (по вашему же предложению) не присвоить вашей раздаче статуса "проверено", поскольку "содержимое не соответствует оригиналу"
Не было бы.
Вот книга.
Качество: Распознанный текст без ошибок (OCR).
Все тире на месте.
Скачайте и проверьте.
|
|
semenag
Стаж: 15 лет 11 месяцев Сообщений: 317
|
semenag ·
18-Окт-11 10:25
(спустя 2 дня 16 часов)
В книге всего 29 страниц. Вычитка их не составит труда. А у меня, например, на стекле лежит книга в 400 страниц. Я ее буду вычитывать всю оставшуюся жизнь... Опять же, кто будет проверять(читай - вычитывать книги релизеров)? Модераторы? так они состарятся раньше времени и точно испортят зрение. Да и ни к чему это. "OCR с ошибками" всего лишь дополнение к оригиналу. Cucumis прав - можно раздавать и без него и будет статус "проверено". Так что я считаю, что существующая система установки статуса "проверено" оптимальная(по крайней мере на сегодняшний момент).
|
|
DjVu-Master
Стаж: 15 лет 1 месяц Сообщений: 6135
|
DjVu-Master ·
06-Ноя-12 02:36
(спустя 1 год, ред. 06-Ноя-12 02:36)
semenag писал(а):
48405884А у меня, например, на стекле лежит книга в 400 страниц. Я ее буду вычитывать всю оставшуюся жизнь...
По дню на том.
Целительные силы - Малахов Г.П. - Том 1, 2 [2002, 2004 г., DjVu, RUS]
|
|
Dr@gon-XXI
Стаж: 16 лет 3 месяца Сообщений: 387
|
Dr@gon-XXI ·
15-Дек-12 10:56
(спустя 1 месяц 9 дней)
Stepanenko.P.V. писал(а):
48333741проэкты
и после этого ты говоришь, что в твоих книгах нет ошибок.
|
|
DjVu-Master
Стаж: 15 лет 1 месяц Сообщений: 6135
|
DjVu-Master ·
15-Дек-12 12:18
(спустя 1 час 22 мин., ред. 15-Дек-12 12:18)
Dr@gon-XXI писал(а):
56841398и после этого ты говоришь, что в твоих книгах нет ошибок.
Ты мне в книге найди ошибку - тогда будем говорить.
|
|
|