kolokol4ok60 · 10-Авг-17 23:27(8 лет 1 месяц назад, ред. 31-Окт-18 15:18)
Большая Советская Энциклопедия 2-е изд. Тома 1-21 Год издания: 1949-1960 Автор: Коллектив Жанр или тематика: Энциклопедия Издательство: Государственное научное издательство Серия: БСЭ Язык: Русский Формат: DjVu Качество: Отсканированные страницы Интерактивное оглавление: Нет Количество страниц: 723, 719 и т. д. Все тома - 107.800 страниц Описание: «Большая советская энциклопедия» (БСЭ) - самый грандиозный издательский проект советской эпохи. На протяжении пятидесяти лет было выпущено три издания. Все основополагающие решения, связанные с работой над БСЭ - от определения политики по ее содержанию до организации полиграфического исполнения, всегда принимались на высшем государственном и партийном уровне. Тома второго издания начали выходить в 1950 году. По 1958 год вышли 50 основных томов и один дополнительный.
Примеры страниц
Доп. информация: В планах пересканировать все тома энциклопедии, но как вы наверное сами понимаете процесс этот будет долгий.
Сканирую в 400 DPI. За недостающие страницы к 1 Тому огромнейшее человеческое спасибо aawaaw
За недостающие страницы к 6 Тому огромная благодарность aawaaw
За недостающие страницы к 5 Тому признателен aawaaw
За недостающие страницы к 7 Тому спасибо aawaaw
4 Том сканировал aawaaw
Помимо черно-белого скана делал для себя цветной вариант, но весит файл около 1000 МБ так что на раздачу выставил только черно-белый скан. Многие высказываются против цветных сканов, но если кому нужен могу выставить и цветной скан. Первый том тоже уже отсканирован, но возникла проблема - не хватает нескольких страниц, они элементарно вырваны, так что необходима ваша помощь. Нужны имено цветные сканы т.к. делаю цветной и черно-белый вариант. Сканирую в 400 DPI. Если у кого-нибудь есть возможность помочь, буду очень благодарен. Взять книгу в Германии элементарно негде. Первый том выписывал из России, но пересылка стоит очень дорого и от недобросовестных продавцов никто к сожалению не защищен так что надеюсь на вашу помощь. Может кто может взять книгу в библиотеке. Нет страниц:
иллюстрация между 44-45
105-106
109-110
иллюстрация между 112-113
203-204
иллюстрация между 280-281
иллюстрация между 284-285
иллюстрация между 296-297
иллюстрация между 400-401
иллюстрация между 508-509
509-510
513-514
553-554
Выставлен 1 Том
За недостающие страницы спасибо aawaaw, без его помощи Том 1 еще долго бы не попал на rutracker PS: Следующие тома планирую сканировать в 600 DPI
Добавлен Том 6. За недостающие страницы спасибо aawaaw Том сканировал в отличие от предыдущих книг, в 600 DPI. Потому-то наверное и размер файла получился почти на 100 MB больше предыдущих. При обработке следующей книги учту, и иллюстрации буду делать 300 DPI.
Я думаю, дело не в dpi иллюстраций. Увеличьте число страниц на повтор словаря символов, сейчас он у вас идёт через 20 страниц. И попробуйте на ступеньку ухудшить сжатие чб текста, отследив "эффект инь", лучше на жирных буквах и особомелких значках. Если, конечно, размер волнует. Самые мелкие индексы я чаще всего нахожу в выходных данных книги и в примечаниях к рисункам и таблицам.
Насколько я понимаю (из личного опыта), аккуратно сжатая страница текста в 1200дпи должна получиться в районе 70-100кб на высшем качестве потерьной компрессии ("почти без потерь", quasilossless). Ну, 150 это предел. А у вас - почему-то размер прыгает, то 80 то 200кб. Без каких-либо иллюстраций. А иллюстрации просто сжаты неправильно. Посмотрите стр. 564 (электронную), с тремя фотками Вавилонской цивилизации. Чанк Sjbz аж 429кб. Такой размер из-за деления фоток на передний и задний слои. дополнено:
ну, я сильно погорячился насчёт 70-100кб. Провёл - для надёжности - эксперимент, всё-таки выходит до 250кб. Видимо, зависимость нелинейная.
Итого: 114 страниц, взятых из середины 6го тома, дали 34мб. То есть _в_среднем_ страница энциклопедии 310кб, и 700-страничный том должен получаться 230-260мб. С иллюстрациями и вкладками.
Переделал 5 Том. Оригинальная статья о Л. П. Берия стала на то место, где и должна находиться по праву. Четыре страницы с расширенной статьей о Беринговом море вставил в конце тома. Спасибо за оригинальные сканы недостаючих старниц aawaaw
Добавил Том 7. Следующие тома буду сканировать опять в 400 DPI, так как размер я так понимаю имеет для многих значение, а разница в 200 DPI дает 100 MB лишнего веса. За недостающие страницы спасибо aawaaw
Добавил Том 8. Тома буду сканировать в 400 DPI, больше никаких экспериментов. Том 7 сканировался в 600 DPI, а так как для себя я делаю цветные сканы, то размер 7 Тома у меня вышел 1440 МB (Черно-белый - 376 MB), размер 8 Тома (400 DPI) вышел 884 MB цветной скан и черно-белый - 270 MB. Так что 200 DPI играют большую роль, а при чтении разницу не сильно и заметно.
Добавил 15-21 тома. Скорее всего больше делать не смогу, так как книги покупал у антиквара в Германии, постепенно по 2-3 книги. Оставшиеся тома купил кто-то другой я опоздал Есть и другие собрания, но они не продаются по 1 книге, надо забирать все 51, а это уже совсем другие деньги и сразу
Из России просят за пересылку 15-25 € за том. Так что за не имением материала проект закрываю. Если кто либо согласен предоставить сканы, то я обработаю. На этом всё!
Сравните, как определяется ген во 2 и 3 изд. БСЭ [если что, 3 изд. БСЭ брал здесь]
Во втором он определяется как МИФИЧЕСКАЯ (!!!это при том, что в 1909 году термин наследственной единицы "ген" введён датским учёным В. Иогансеном, а в 1910 году Томас Хант Морган доказал, что гены расположены в хромосомах!!!) элементарная единица наследственности, а в 3 изд. БСЭ такой фигни уже нет, там ген определяется как вполне себе немифическая единица наследственности.
CommuKira, сказал, доказал - про евгенику и нацизм не слышал, нет? Это последствия - маятник качнулся от генетики, которой нацисты оправдывали уничтожение неудобных "низших" рас и людей во имя самозванных "высших".
77104433CommuKira, сказал, доказал - про евгенику и нацизм не слышал, нет? Это последствия - маятник качнулся от генетики, которой нацисты оправдывали уничтожение неудобных "низших" рас и людей во имя самозванных "высших".
Только в СССР про евгенику и нацизм слышали, больше нигде не слышали, и маятники не качались.
Wasko2009
Да, в остальном мире вступали в нацистские партии. Будущие королевы зиговали. Американские олигархи финансировали нацистов, выращивали евгенику. А европейцы просто привели к власти нацистские режимы и слились в экстазе с Гитлером. И, если не в курсе, - СССР был единственной социалистической страной на тот момент, и имел свой взгляд и на нацизм, и на евгенику, отличный от других. Он ведь в итоге и оказался правильным. А генетика - да, временно пострадала, из-за, так сказать, "беспорядочных половых связей". Но потом быстро наверстали... Под Херсоном, например, еще сохранились поля для генетических модификаций растений - их видно даже со спутника по характерной круглой форме.
Смотрю вариант БСЭ в раздаче без слоя распознанного текста. Решил для пробы распознать для примера 6й том. Использовал FineReader 15. Один том несколько часов распознавался и экспортировался на моём ноутбуке. Вот результат DJVU (это оригинал из этой раздачи с внедрённым внутри слоем распознанного текста) и для оценки качества ещё чистый текст без форматирования TXT. Ещё PDF вариант, для демонстрации возможностей FineReader делать PDF файл в котором весь удачно распознанный (с высокой уверенностью) текст отображается как текст, а слабо распознанный (низкая уверенность) вставляется в виде картинок со словами из оригинального DJVU, иллюстрации тоже вставляются как картинки. Конечно такой PDF не сравнить по качеству с оригинальными DJVU фотографиями, но вполне годится для оценки качества распознавания, а также для демонстрации возможностей FineReader. Если у кого то есть желание то можно все 21 том распознать, мог бы рассказать по шагам что для этого надо, т.к. 21 раз по 4 часа тратить мне как то не хочется пока, желающий мог бы распознать все 21 том и выложить в отдельной раздаче или обновить эту. Только нужно оценить качество распознавания в загруженном мной примере и стоит ли вообще это делать, интересно ли кому то искать текст и выделять/копировать его. Слой распознанного текста позволяет искать по словам, например в WinDjView программе по Ctrl+F, при поиске найденное слово выделяется прямоугольником, также в WinDjView можно экспортировать текстовый слой через Файл / Экспортировать текст. PS. Для информации: Внутри DJVU файла слой распозннаного текста хранится в виде XML файла (сжатого архиватором), в этом XML хранится информация о параграфах, строках и словах, для каждого слова хранится текст слова плюс координаты прямоугольника, ограничивающего слово, что позволяет при поиске выделять точно слово на картинке DJVU. Из всех ссылок выше безусловно самый подходящий вариант это оригинальный DJVU со встроенным внутрь слоем распозннаного текста. Может kolokol4ok60 хочет распознать БСЭ, если есть интерес.