malshin · 23-Янв-16 12:12(9 лет назад, ред. 03-Янв-25 22:22)
Знание-сила (55 номеров) Год издания: 1926 - по наст.время Годы в раздаче: 1926-1941 (фрагментарно) Жанр или тематика: Научно-популярный, общеобразовательный Издательство: ОГИЗ "Молодая гвардия", "Детиздат" ЦК ВЛКСМ и Наркомпроса Язык: Русский Формат: PDF, DjVu Качество: Отсканированные страницы, 600dpi Периодичность: 12/24 номеров в год Количество страниц: 24-36 Сканирование: malshin Описание:
«Знание-сила» - научно-популярный и научно-художественный журнал, основанный в 1926 году. Публикует материалы о достижениях в различных областях науки — физике, астрономии, космологии, биологии, истории, экономике, философии, психологии, социологии, глобализации.
Доп. информация
Сканы необработанные, "как есть", т.к. хорошо передают винтажность той эпохи конца НЭПа и надеюсь понравятся любителям и ценителям старых журналов. Качество сканирования (разрешение) 600 точек на дюйм, без распознавания текста (OCR), поэтому размер каждого номера весьма велик (порядка 160-280Мбайт), несколько номеров умеют утраты страниц и обложек.
Тираж журналов был от 25тыс. до 56тыс. (в 1939г.) вне зависимости от того, как выходил журнал (один или два раза в месяц). В первом году выпуска (1926) тираж журнала был всего 4 тыс. экз.
Пополнение раздачи вероятно, по мере покупки номеров за другие довоенные годы или взятия таких номеров на оцифровку со стороны.
Предвосхищая будущие вопросы, сразу отвечаю - дежавю этих сканов не делаю и в будущем не собираюсь (ну разве что для особо раритетных номеров 1926-1928 годов, для которых возможно буду делать и ч/б варианты, по возможности наличия у меня свободного времени). В целом данный формат с практической точки зрения меня не интересует. Обработку с приведением к черно-белому варианту также производить не буду (с теми же исключениями).
23.04.2014 - первый релиз. 22.02.2016 - добавлено 7 номеров за разные годы. 01.08.2018 - добавлено 7 номеров, №7,8 за 1935, №2-3,9,10-11 за 1939 годы. 21.06.2019 - добавлено 4 номера за 1926,1930 и 1932 годы. №9 за 1926 - весьма редкий (раритет, тираж всего 4.000 экз), добавлен в разных вариантах - djvu и pdf как в цвете, так и в ч/б варианте. 26.04.2020 - добавлено 2 номера: 1933 №23-24 и 1935 №1, в 1935 №8 - дополнены недостающие страницы и задняя обложка. 13.08.2022 - добавлен №3 за 1938 год. 26.07.2023 - добавлено 3 номера: №9 за 1928, №12 за 1934, №8 за 1937, №2-3,4,6 за 1939 улучшены (восстановлены утраты) 26.01.2024 - добавлено 2 сдвоенных номера: №11-12 за 1933 и №1-2 за 1940, восстановлены утраты в №3-4 за 1933 и в №10-11 за 1939. ВАЖНО ! Проведена массовая OCR всех файлов в pdf, что позволило уменьшить втрое размер самой раздачи. Для тех, кому нравятся "тяжелые" файлы номеров предыдущего варианта раздачи - ОБЯЗАТЕЛЬНО КАЧАЙТЕ ДАННУЮ РАЗДАЧУ В ДРУГУЮ ПАПКУ, ИНАЧЕ ВЫ ЗАТРЕТЕ ПРЕДЫДУЩИЙ ВАРИАНТ ! 03.01.2025 - добавлен №4 за 1941 год.
В розыске (куплю или возьму на оцифровку):
Любые номера за период с 1926 по 1941 год, даже те, что уже есть в раздаче (из-за имеющихся у них утрат и обрезок по краям). Подойдут номера и в удовлетворительном состоянии, главное желательно без утрат и без следов подмоканий и залитий жидкостями/маслом (волнистости и излишней прозрачности от них), которые сильно затрудняют оцифровку.
Время раздачи: До первых пяти сидов в ближайшие несколько дней
Огорчает только одно- мало тех, кто использует своё время во благо других. Автор сие раздачи- нужный и заслуживающий уважение человек! Безграничное спасибо за труд и саму идею!
Торрент обновлен 21.06.2019
Добавлено 4 номера - два номера за 1930, один - за 1932 и редкий раритетный №9 за 1926 (первый год выпуска журнала). Тираж журнала в тот год был ну просто мизерным - всего 4.000 экз. Поэтому сделал исключительно его не только в цвете, но и в ч/б обработанном варианте, с OCR и в двух форматах (pdf, djvu).
Торрент обновлен 26.04.2020
Добавлены два номер - №23-24 за 1933 и №1 за 1935. В №8 за 1935 добавлены отсутствующие ранее страницы и задняя обложка. Раздавать начну завтра, в понедельник.
Торрент обновлен 26.01.2024
Добавлено 2 сдвоенных номера: №11-12 за 1933 и №1-2 за 1940, восстановлены утраты в №3-4 за 1933 и в №10-11 за 1939.
---- ВАЖНО ! Проведена массовая OCR всех файлов в pdf, что позволило уменьшить втрое размер самой раздачи. Для тех, кому нравятся "тяжелые" файлы номеров предыдущего варианта раздачи - ОБЯЗАТЕЛЬНО КАЧАЙТЕ ДАННУЮ РАЗДАЧУ В ДРУГУЮ ПАПКУ, ИНАЧЕ ВЫ ЗАТРЕТЕ ПРЕДЫДУЩИЙ ВАРИАНТ !
Dsiktgrf ndq
О наличии OCR (подложенного под картинку текста) можно узнать только если его специально искать (выделять) мышкой, потому никакого вреда этот текстовый слой не способен нести, сочувствую, что имеете несварение.
Другое дело, что сам распознанный текст может быть бесполезным, например Акробат распознаёт на русском так, что пользоваться им невозможно, получается смесь русского/английского/символов вперемешку. При этом, на фоне общего размера файла, текст занимает очень мало места, допустим в файле 1926/09 (цветной).pdf, если отбросить картинки, то останется 283 Кб, если вы не способны переварить наличие этих килобайт, то это ваши проблемы и не стоит выносить их на всеобщее обсуждение, мне это точно не интересно, а релизёру, возможно, ещё и неприятно это выслушивать, malshin и так урезал раздачу на 2/3. malshin
Было время, когда Вас ругали за большой размер и файлы пережимались для дальнейшего распространения, сейчас вижу настал тот час, когда приняли решение пойти навстречу читателю или задумались об экономии пространства личного архива, в любом случае это Ваш выбор, и оспаривать его будут не меньше прежнего, такая жизнь, всегда найдутся недовольные, со своей стороны могу обещать на их "фи" своё двойное "фи", однозначно буду вытеснять оппозицию, первый аккаунт уже получил предупреждение, видимо вышло слабое, не подействовало, и второй аккаунт ранее был замечен в стадных забастовках не по делу, а до кучи, вот и сейчас процесс повторяется, потому тоже находится в особых заметках. malshin
Мелкая поправка - по факту, не из-за OCR файлы уменьшились, а из-за пересжатия картинок.
Ранее (в крупных файлах) было сжатие JPEG 90% качества, после обновления раздачи качество картинок имеет 59%, это примерно равно среднему качеству, если сжимать в pdf-редакторах по шкале низкое/среднее/высокое/максимальное. Для 600 DPI среднее качество - это разумный выбор, поддерживаю.
А с текстовой подложкой действительно не всё гладко, использовать Акробат для распознавания - худший выбор, сравнение на случайном файле 1926-09, первый абзац
сравнение
Акробат (файл из раздачи)
Почти все мальчики •i1ашей колотш
.1юбнл11 работать _в ~сто.1я-рке", возиться
часами с действующими моделями паровой
машины, ,:щнамо, водяной ме.1ьиицы,
• 1есопильноrо станка, или рассматривать
книги по технике. Когда один руководитель
предложил ребятам организавать
технический кружок, то все мальчики
с большой радостью 11риветствова.1и
возникновение этого кружка.
Свое об'ед11нение мы назвали "Кружком
юных инженеров'·.
На пrрвом собрашш мы составили
nдан работы: собирались изучать устройство
машин, строить модеJ111.
Одно из следующих собраний было
посвящено беседе о машинах, об энерпш
11 ее превращении. Беседа эта бы:1а построена
на опытах с нашими деiiствующим11
моделями. На глазах ребят э~iерr11я
тепла, идущая от примуса, нагревала
воду в паровой машине, превращала
ее в пар, который толкал поршень 11
маховое I\0i1cco; энергия тепла превращалась
в энергию движения. От махового
коле;а энергия передава:1ась 11:i лесоЛ11,1ьныii
станочек, где кр)товое ,1.в11же-
PDF-XChange Editor
Почти все мальчики -нашей колонии
любили работать в „столярке*, возиться
часами с действующими моделями паро-
вой машины, динамо, водяной мельницы,
лесопильного станка, или рассматривать
книги по технике. Когда один руково-
дитель предложил ребятам организовать
технический кружок, то все мальчики
с большой радостью приветствовали
возникновение этого кружка.
Свое об‘едипение мы назвали „Круж-
ком юных инженеров*'.
На первом собрании мы составили
план работы: собирались изучать устрой-
ство машин, строить модели.
Одно из следующих собраний было
посвящено беседе о машинах, об энергии
и ее превращении. Беседа эта была по-
строена на опытах с нашими действую-
щими моделями. На глазах ребят энер-
гия тепла, идущая от примуса, нагрева-
ла воду в паровой машине, превращала
се в пар, который толкал поршень и
маховое колесо; энергия тепла превра-
щалась в энергию движения. От махово-
го колеса энергия передавалась на лесо-
пильный станочек, где круговое движе-
Это сравнение не означает, что Вам обязательно нужно освоить ещё какой-нибудь pdf-редактор, если Акробат всем устраивает, то пусть будет так, а кому приспичит, тот для себя перераспознает, раньше не было никакого OCR и как-то обходились.
То есть, уменьшение размера файлов произошло не из-за замены сканированных картинок на текст OCR, и сканы остались на месте. Тогда прошу прощения, не так понял. malshin
Вам отдельное спасибо, делаете очень полезное и правильное дело. папаВлад
Про OCR и его технический смысл я знаю, неправильно понял сообщение ТС.
сейчас вижу настал тот час, когда приняли решение пойти навстречу читателю или задумались об экономии пространства личного архива, в любом случае это Ваш выбор
Об экономии пространства и раньше не думал, и теперь с обновлением компа тем более не задумываюсь. Просто часто просили ужать данную раздачу, прочие раздачи вроде бы все ужал. Проблема в том, что распознавание как и корректировка распознанного потом (подрезка белых уголков) занимает часто много времени, которого у меня и так мало - как пример, простое перераспознавание (пусть и в автомате) полусотни номеров данной раздачи заняло несколько часов, и корректировка потом столько же.
папаВлад писал(а):
Мелкая поправка - по факту, не из-за OCR файлы уменьшились, а из-за пересжатия картинок.
Да это я в курсе, есть вариант без ухудшения качества скана, но, увы, размер файлов при этом не уменьшается.
папаВлад писал(а):
А с текстовой подложкой действительно не всё гладко, использовать Акробат для распознавания - худший выбор, сравнение на случайном файле 1926-09, первый абзац
И с этой проблемой я давно знаком, на довоенных журналах такое постоянно, более-менее чистое распознавание Акробат делает на послевоенных журналах, где печать была покачественнее (я промолчу про современный уровень печати, где акробат распознает почти 100%, включая спецзнаки).
папаВлад писал(а):
PDF-XChange Editor
Вот этот редактор видимо придется поизучать. Навскидку - может ли он делать групповое распознавание и как будет с размером файлов, даже при условии ухудшения качества скана? А также распознает ли он нестандартные размеры скана (типа А3, некратные А4 и пр.)?
Вот этот редактор видимо придется поизучать. Навскидку - может ли он делать групповое распознавание и как будет с размером файлов, даже при условии ухудшения качества скана? А также распознает ли он нестандартные размеры скана (типа А3, некратные А4 и пр.)?
В XChange пакетные операции реализованы иначе, чем в Акробат, и нужна версия PRO (или Plus), тогда появляется отдельная программа для пакетных операций PDF Tools.
Распознавание и сжатие - разные операции, то есть если нужно и сжать и распознать папку с файлами, то в два захода.
Про нестандартные размеры при распознавании - программе без разницы, хоть А0, хоть почтовая марка, главное соблюдение DPI, то есть не нужно запутывать программу и обманывать с настоящими размерами в бумаге, если почтовой марке присвоить неправильный DPI и сбить с толку, например превратив её в метр на полтора, то и распознавание будет с ошибками, ФайРидер в таких случаях предлагает исправить DPI на автоматически определившееся, как говорится при прямых руках и результат будет прямой, ну это такие нюансы при оцифровке, ещё нужно набить глаз и руку несколькими неудачами.