Даль В.И. - Толковый словарь живого великорусского языка 1-4 тт. [2006, PDF, RUS]

Страницы:  1
Ответить
 

ComboFZ

Стаж: 14 лет 11 месяцев

Сообщений: 166


ComboFZ · 23-Янв-20 07:57 (5 лет 10 месяцев назад, ред. 27-Янв-25 13:33)

Толковый словарь живого великорусского языка 1-4 тт.
Год издания: 2006
Автор: Даль В.И.
Жанр или тематика: Лингвистика
Издательство: М.: ИД «РИПОЛ классик»
ISBN: 5-7905-4703-6
Язык: Русский
Формат: PDF
Качество: Издательский макет или текст (eBook)
Интерактивное оглавление: Нет
Закладки: Да
Количество страниц: т.1 - 754с., т.2 - 785с., т3 - 546с., т.4 - 669с.
Описание: В этом издании предпринята попытка приблизить к нормам современного русского правописания бессмертный труд В. И. Даля. Главная цель — вернуть это великое произведение широким слоям читателей: школьникам, студентам, журналистам, литераторам, просто всем тем, кому небезразлична судьба родного языка, кто хотел бы совершенствовать свою речь, говорить грамотно, образно, понятно.
Примеры страниц
Доп. информация:
Книга в формате PDF взята на просторах интернета и улучшена:
- для удобной навигации по книге добавлены закладки с точным позиционированием
- исправлена корявость шрифтов при копировании текста (кроме гласных с ударениями)
- удалены дублирующиеся страницы в 3-м томе
- частично оптимизированы картинки (растр) без ухудшения качества
- уменьшены поля на страницах для удобного просмотра на смартфонах и планшетах
Download
Rutracker.org не распространяет и не хранит электронные версии произведений, а лишь предоставляет доступ к создаваемому пользователями каталогу ссылок на торрент-файлы, которые содержат только списки хеш-сумм
Как скачивать? (для скачивания .torrent файлов необходима регистрация)
[Профиль]  [ЛС] 

J.Kovalev

Стаж: 15 лет 6 месяцев

Сообщений: 280

J.Kovalev · 25-Дек-24 07:07 (спустя 4 года 11 месяцев, ред. 25-Дек-24 07:07)

ComboFZ написал:
Цитата:
Доп. информация:
Книга в формате PDF взята на просторах интернета и улучшена:
- для удобной навигации по книге добавлены закладки с точным позиционированием
- исправлена корявость шрифтов при копировании текста (кроме гласных с ударениями)
Гласная буква с ударением — это сочетание двух символов: символ буквы + символ ударения. Символ ударения — это комбинируемый диакритический знак (Unicode Number U+301, HTML Code &#769).
Автор раздачи проделал ОЧЕНЬ большую работу, но результат неудовлетворительный, поскольку задача полнотекстового поиска НЕ решена. А без полнотекстового поиска такие значимые издания как словари и энциклопедии мало пригодны для серьёзной работы с содержимым издания
Буду ОЧЕНЬ признателен Автору раздачи, если он скорректирует символьные карты встроенных в PDF шрифтов с учётом вышесказанного!
Ещё одна просьба.
Анализ причины отсутствия полнотекстового поиска (ПТП) в PDF-файлах книг данной раздачи показал следующее:
1. В томах 1 и 2 ПТП НЕТ (!), а в томах 3 и 4 ПТП ЕСТЬ, но с ограниченными возможностями: найти фрагмент текста без учёта ударений можно, а с учётом ударений — нельзя!
2. В томах 3 и 4 опция ПТП поддерживается встраиванием в эти PDF-файлы многочисленных СПЕЦИАЛЬНЫХ шрифтов (10–15 шт.) содержащих только специальные дополнительные символы кириллицы, изображение которых представляют собой стандартные символы кириллицы, объединённые в одной позиции с диакритическим знаком ударения, символьные карты которых переадресованы на позиции символов кириллицы в таблице Юникод.
ВОПРОС:
Можно ли добавить вышеуказанные «СПЕЦИАЛЬНЫЕ» шрифты в файлы томов 1 и 2 для восстановления ПТП?
[Профиль]  [ЛС] 

astaw.

Стаж: 9 месяцев

Сообщений: 99


astaw. · 26-Сен-25 20:33 (спустя 9 месяцев)

J.Kovalev писал(а):
87153454Гласная буква с ударением — это сочетание двух символов: символ буквы + символ ударения. Символ ударения — это комбинируемый диакритический знак (Unicode Number U+301, HTML Code &#769).
Автор раздачи проделал ОЧЕНЬ большую работу, но результат неудовлетворительный, поскольку задача полнотекстового поиска НЕ решена. А без полнотекстового поиска такие значимые издания как словари и энциклопедии мало пригодны для серьёзной работы с содержимым издания
Возможно данную проблему можно решить натянув на издательский макет OCR слой для поиска.
Текст очень четкий так как это не скан, при определении символа есть вероятность что "À" будет определено как "А".
Что даст возможность найти слово поиском.
На сканах OCR игнорирует "À" определяя как "А".
По крайней мере в раздаче solar power, сканы где есть "À", в OCR слой были записаны как "А".
Но там сканы ужасные, текст слеплен порой, поиск слов целиком не работает.
Потому в теории данные можно обработать автоматизированным методом посредством OCR.
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error