Друзья,
1. Для самых маленьких/ленивых
:
В условиях нестабильной окружающей обстановки я решил каждый месяц делать бэкапы нужных сайтов.
Не все знакомы с необходимыми технологиями, поэтому для вашего удобства решил облегчить доступ к информации и поделиться наработками.
На текущий момент для вас создано:
Мои ресурсы в сети TOR:
Поиск раздач и хэшей по ежемесячному бэкапу базы rutr.life:
http://jundnd4xlfxd72xotv6gka5pnhsc2quztafbklvo4koizvnsq3pblayd.onion
==
Бэкап версия сайта ru*tor.info:
http://lx7x6ucdwztktuv5y6a56kx6knhcra4pbfcch3ggos7mvqwaqqzo4tqd.onion
==
Бэкап версия сайта dugtor.ru:
http://qa72hq6ntxifx3wqtedyymoaxjpmmxponhdrsjiaqevxqudjth7lneqd.onion
==
Бэкап версия русской и английской Википедии в сети TOR:
http://ibdtyly4nkgonmkumfn6d32v6y76c7p4p76iv5zo2pkpbv5oxqggogad.onion
==
Бот rutracker_hash_bot - отправляете ему ссылку, в ответ получаете .csv-файл с хэшами для скачивания (из бэкапа базы).
https://t.me/rutracker_hash_bot
Мои tg-каналы:
Мониторинг обновлений всех раздач оригинального онлайн-сайта rutr.life каждую минуту:
https://t.me/rutracker_updater
==
Мониторинг обновлений всех раздач оригинального онлайн-сайта ru*tor.info каждую минуту (убери звездочку):
https://t.me/ru*tor_updater
2. Для тех, кто постарше:
Качаем архив от пользователя y3401, разархивируем его, большинству пригодится только 7z-файл в папке Hashtor/Полные БД(Infotor 1 и 2).
Надо выбирать файл с последней датой на текущий момент, допустим:
Hashtor/Полные БД(Infotor 1 и 2)/torrents_sqlite3_20240629.7z
Разархивируем этот файл torrents_sqlite3_20240629.7z, из этого архива получается файл torrents.db3.
В общем в итоге имеем файл torrents.db3, остальное можно удалить.
2.1 Работа с файлом torrents.db3 для Linux-пользователей в терминале:
Для Linux-пользователей уже можно делать SQL-запросы в терминале в этот файл с помощью утилиты sqlite3.
Допустим найдем в файле все строки где поле title содержит значение 'Над пропастью во ржи' и отсортируем выдачу по дате регистрации торрента, убыванию:
sqlite3 torrents.db3 "SELECT * FROM torrent WHERE title LIKE '%Над пропастью во ржи%' ORDER BY date_reg DESC;"
Ответ терминала, первая строка:
6041451|3F3A0474489C51612286D39B47B3DFC1D6E31D50|Филологическая книга СГУ - Петренко Д. И. - Роман Дж.Д. Сэлинджера «Над пропастью во ржи» и его переводы на русский язык: монография [2016, PDF, RUS]|2083055|2021.04.16 10:55:00|2524
2.2 Работа с файлом torrents.db3 для Windows и Linux-пользователей в программе Dbeaver:
Скачиваем и устанавливаем бесплатную программу для просмотра любой SQL-базы Dbeaver, бесплатная версия это Community
https://dbeaver.io/download/.
В ней открываем наш файл torrents.db3 и уже можем его просматривать:
Символ вилки слева наверху -> New Database Connection -> Тип выбираем sqlite -> Путь - путь к файлу torrents.db3 -> finish
Видим что база открыта, слева раскрываем базу, раскрываем tables, два раза кликаем на torrent, посередке открылись окна Properties, Data, ER Diagram. Кликаем на Data.
Видим что нам открылась база с первыми 200 значениями и всеми полями.
Если убрать ограничение в 200 значений то программа может зависнуть ведь в базе более 2 миллионов записей.
Поэтому для поиска по базе просто откроем окно SQL запросов: Наверху опция SQL Editor -> Open SQL Script.
И тут уже можем искать по этой базе тем же SQL-запросом, допустим:
SELECT * FROM torrent WHERE title LIKE '%Над пропастью во ржи%' ORDER BY date_reg DESC;
И в появившемся окне результатов уже можно убрать ограничение в 200 значений.
3. Для самых взрослых:
Те, кто продвинут в современных технологиях могут сделать то же что и я:
rutracker:
Файл torrents.db3 с помощью настольного Dbeaver экспортировать в файл импорта SQL.
На своем PostgreSQL-сервере создать базу и таблицу для этого файла, поля как в самом файле, импортировать этот файл в свою базу, для ускорения выборки можно создать индекс столбику title.
Теперь у вас есть PostgreSQL-база с раздачами Rutracker, можно делать SQL-выборку в терминале.
Для удобства можно пойти дальше и сделать веб-интерфейс на Flask + psycopg + JQuery Ajax и завернуть его в docker-контейнер.
Теперь у вас есть простой веб-сайт с поиском по бэкапу rutracker.
ZIM-бэкап rutracker делать не стал - скачивался более 7 суток..
ru*tor, dugtor:
Касаемо бэкапов ru*tor, dugtor - я их сделал с помощью утилиты zimit которая сканирует любой сайт и сохраняет его в единственных ZIM-файл.
Чтобы поднять веб-сайт на основе этого файла поднимаете в Docker kiwix-контейнер.
Теперь у вас есть личная веб-копия любого сайта.
Продолжительность:
Бэкап ru*tor делался 1 день 5 часов 20 минут, итоговый размер ZIM-файла 7 GB
Бэкап dugtor делался 15 часов 15 минут, итоговый размер ZIM-файла 35 GB
wikipedia:
Касаемо бэкапа Wikipedia - Wikipedia сама предлагает уже готовые ZIM-файлы
https://wiki.kiwix.org/wiki/Content_in_all_languages - я скачал полные версии (с меткой all maxi) российской и англоязычной вики.
Также поднимаем kiwix-контейнер или просто в программе Kiwix и у вас есть личная копия вики с доступом через браузер.
Один kiwix-контейнер/приложение может обслуживать сразу несколько ZIM-файлов.
Выложил бы полную инструкцию но кода получилось на 600 строк минимум, основные моменты изложил в этом комментарии.