Рип Safebooru ID 3.6xx.xxx (август - ноябрь 2021) + Gelbooru, Yande-re, Zerochan etc [Art] [2021] [JPG]

Страницы:  1
Ответить
 

AlexeyPUA

Стаж: 12 лет 7 месяцев

Сообщений: 488


AlexeyPUA · 01-Дек-21 15:38 (2 года 9 месяцев назад, ред. 25-Фев-22 10:06)

Рип Safebooru ID 3.6xx.xxx (август - ноябрь 2021) + Gelbooru, Yande-re, Zerochan etc
Тип раздачи: Art
Год выпуска: 2021
Количество: 122765
Формат: JPG
Разрешение: >=1.2 MPix, >=900 по короткой стороне; <= 60 MPix, <=9000 по длинной стороне
Описание: Продолжение серии композитных рипов нескольких имиджборд
https://rutr.life/forum/viewtopic.php?t=6133598 ID 3.5ХХ.ХХХ (июль - август 2021) ~142.000 ~211 GB
https://rutr.life/forum/viewtopic.php?t=6087518 ID 3.4ХХ.ХХХ (апрель - июнь 2021) ~132.000 ~202 GB
https://rutr.life/forum/viewtopic.php?t=6045099 ID 3.3ХХ.ХХХ (декабрь 2020 - март 2021) ~135.000 ~200 GB
https://rutr.life/forum/viewtopic.php?t=6006875 ID 3.2ХХ.ХХХ (сентябрь-декабрь 2020) ~134.000 ~203 GB
https://rutr.life/forum/viewtopic.php?t=5957382 ID 3.1ХХ.ХХХ (июнь-сентябрь 2020) ~135.000 ~213 GB
https://rutr.life/forum/viewtopic.php?t=5922193 ID 3.0ХХ.ХХХ (февраль-май 2020) ~140.000 ~216 GB
https://rutr.life/forum/viewtopic.php?t=5862448 ID 2.9ХХ.ХХХ (сентябрь 2019 - январь 2020) ~102.000 ~141 GB
https://rutr.life/forum/viewtopic.php?t=5818522 ID 2.7M-2.8М (ноябрь 2018 - август 2019) ~141.000 ~177 GB
https://rutr.life/forum/viewtopic.php?t=5673690 ID 2.5M-2.6М (март - ноябрь 2018) ~75.000 ~110 GB
https://rutr.life/forum/viewtopic.php?t=5561386 ID 2.3M-2.4М (сентябрь 2017 - март 2018) ~100.000 ~115 GB
https://rutr.life/forum/viewtopic.php?t=5449970 ID 2.0M-2.2М (октябрь 2016 - июль 2017) ~100.000 ~120 GB
с использованием (в порядке убывания приоритета дедубликации)
S - Safebooru (относительно приличный и неплохо подобранный арт, ОСНОВА РЕЛИЗА)
Y - Yande-re (много качественных сканов - и возни с их рихтовкой) Questionable в отдельных папках
G - Gelbooru (мощный NSFW ресурс, дополняющий safebooru) Q в отдельных папках
C - chan-sankakucomplex (эпическая борда, но ее использование прекращаю) Q в отдельных папках
Z - zerochan (очень интересные подборки, из которых много уникальных)
A - anime-pictures (неплохой ресурс, но не очень большой на фоне предыдущих)
K - Konachan (в основном обои, использование прекращаю) встречается Q
Изображения организованы и подготовлены в целом аналогично предшествующим рипам:
- выполнена группировка и архивирование по пропорциям (dimensions 2 folders) источникам и диапазонам ID (смотрите список файлов)
сегментация изображений по пропорциям, в прорядке убывания приоритета:
* 7x10 +/- 4% страницы артбуков, самая массования пропорция 41062 шт в релизе
* 3x4 +/- 10% "широкие" страницы 18043 шт
* 1x1 +/- 20% примерно "квадратные" 19776 шт
* 3x2 +/- 40% ландшафтная ориентация, в том числе обои 24784 шт
* 2x3 +/- 40% "высокие" страницы, имена папок начинаются с 1х2 19100 шт

- сделана конверсия PNG -> JPG (качество 94%), экстремально большие изображения уменьшены до верхних порогов
- в имени файла отображены "борда - ID - фендом или несколько ~ персонаж или несколько (автор)"
вручную
- прочищены страницы комиксов (-comic), сильно затекстованные страницы и обложки артбуков
косплей и другие реальные фото, пейзажи без персонажей, очень уж примитивные скетчи и прочее, обо что спотыкались глаза
- выполнена значительная работа по обрезке, иногда цветокоррекции и наращиванию однородного фона,
изредка даже сегментации составных картинок и ретуши
- произведена весьма основательная дедубликация (Antidupl NET) в том числе с предыдущими релизами
В итоге релиз состоит из более-менее чистых персонаже-центрических CG/art изображений, и это не спроста
Этот и другие мои сайт-рипы являются частью проекта BOORU CHARS, который представляет из себя:
- набор данных для анализа (нейронными сетями и т.п.) изображений рисованных/CG персонажей
- каталог арта по аниме и игровым фендомам и их персонажам, а также авторам
Подробности о проекте на Github
На трекере есть раздача метаданных и 512px-иконок от 2019 года и ее реинкарнация 1280px от 2021 года.
Второй датасет - BOORU_CHARS_2021 - уже стал основой для нейросетевого детектора и его применение будет расширяться.
Данный релиз - третий после "отсечки", еще несколько итераций и грядет дополнение BOORU_CHARS_2022 (не только с "новинками", но и подгоном немалого количества старого арта).
Также, помимо цепочки рипов, я поддерживаю набор тематических релизов N-Titles, ознакомление с которым можно начать отсюда
Также в релиз включены несколько текстовых (tab delimited) файлов:
V2021D_files с информацией по постам (разрешение, размеры, MD5 и т.п.), а также собранными в одну строку тегами фендомы / персонажи / авторы
V2021D_tags все теги, включая "общие", по одному тегу одного поста в строке 2650320 строк

Примеры изображений пока что что из предыдущего релиза, дойдут руки - обновлю
Примеры изображений 3x2 - подходят для компьютерных экранов
Примеры изображений 7x10 - страницы и обложки артбуков
Примеры изображений 3х4 - на Sankaku попадается Marvel-овщина, которой нет больше нигде
Примеры изображений 1х2 - свежая находка художник wlop

Правда же - удобно, когда можно отобрать весь арт художника по маске имени файла *(wlop)*
Примеры изображений 1х1 - как насчет серии значков с ними
В релизе есть легкое эччи - в основном в папках с суффиксом Q
Нет фронтальной нецензурированной обнаженки (nipples, pussy, penis) и ничего (даже издалека) похожего на явный хентай.
Однако телеса с минимумом одежды или ненавязчивой цензурой, толстые намеки и взрослые шутки встречаются: аниме - оно такое, из песни слова не выкинешь ...
Правила приличия существенно отличаются от сайта к сайту, например на yande-re вообще любое изображение лолей считается questionable
В релизе эти различия сглажены, и тем не менее,
как следствие политики сайта, самые ядреные архивы - gelbooru.Q

Но даже там на многое не рассчитывайте.
Download
Rutracker.org не распространяет и не хранит электронные версии произведений, а лишь предоставляет доступ к создаваемому пользователями каталогу ссылок на торрент-файлы, которые содержат только списки хеш-сумм
Как скачивать? (для скачивания .torrent файлов необходима регистрация)
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error