RVC (Retrieval Based Voice Conversion) 1006.2 x64 [2023, ENG + RUS]

Ответить
 

Dimitry-Z

Стаж: 14 лет 10 месяцев

Сообщений: 48

Dimitry-Z · 17-Мар-24 22:06 (7 месяцев назад, ред. 07-Апр-24 12:34)

RVC 2 (1006v2) (Retrieval Based Voice Conversion) [WebUI + RT] Сборка от Rus.sak
Год выпуска: 2023
Версия: 2 (1006v2)
Разработчик: RVC-Project
Сайт разработчика: GitHub
Автор сборки: Rus.sak
Разрядность: 64bit
Язык интерфейса: Английский + Русский
Таблэтка: не требуется
Системные требования: Windows 10, 11; Видеокарта Nvidia (новых поколений, желательно с не менее 8 ГБ VRAM)
Описание: Основанный на VITS фреймворк, объединяющий в себе инструменты для изменения голоса, разделения вокала и аккомпанемента, обучения голосовых моделей и работы с файлами моделей. Функционал разделения поддерживает работу с моделями UVR.
Внимание! Во всех путях и названиях файлов (при установке и во время работы) избегаем пробелов и кириллицы!
Ряд связанных с данным инструментом вопросов обсуждался в комментариях к раздаче UVR.
2024-03-24. Раздача обновлена по требованию модератора x86-64. Просьба перекачать торрент.
Модели голосов
Скачать с mail.ru
За модели большое спасибо Rus.sak
Описание
Отличие от других источников:
1.Переименованны для правильного восприятия/убрана кириллица, которая может стать причиной неработоспособности модели.
2.Отсортированны по алфавиту/по папкам.
3.Оставленны только рабочие, и имеющие файл индекса, без которого использование модели невозможно.
4.Модели с иностранным исполнителем/персонажем в разделе RU, говорит о голосе русскоязычного диктора, который перевёл данного исполнителя/персонажа и с которого была обучена модель.
5.Русскоязычные модели отобраны по принципу «без акцента, картавости и искажений».
Установка модели:
Перетащить модель.zip в соответствующее окно запущенного приложения, которое самостоятельно распакует zip в нужную директорию, либо разархивировать и поместить папку с моделью в корень приложения - weights.
Родственные раздачи
Установка
1. Распаковать архив. Путь (названия папок) не должен содержать пробелов и кириллицы.
2. Запустить файл "RVC 2.exe" (также можно использовать "RVC 2 Ru.exe", "RVC 2 En.exe" или "RVC 2 Realtime.exe" для запуска необходимого продукта без захода в меню).
3. При запуске необходимо разрешить доступ (поставив "галочку") к домашней (локальной) сети, для того чтобы оболочка WebUI могла взаимодействовать с вашим жёстким диском (чтение и запись подопытных файлов)-(работа в офлайн); если будет необходимость скачивать модели через оболочку, то необходимо разрешить так же доступ в общественную сеть (работа офлайн + онлайн).
Дополнительная информация
Инфо:
Пакет состоит из двух составляющих: RVC-WebUI (разделение, обучение, конвертация и т.д.) и SVC-RealTime (замена голоса в реальном времени.)
1. Для запуска пакета используется CMD \ Python.
2. Установка Python не требуется т.к. он уже предустановлен в пакет.
3. В качестве оболочки (графического интерфейса WebUI) пакета используется браузер.
4. Процесс действий и статус их выполнений прослеживается через свёрнутое окно команд.
5. Первый запуск происходит достаточно долго.
6. Разрешается запуск только одного экземпляра подобных пакетов одновременно.
7. По завершению работы не забываем закрывать окно команд!
Отличие от оригинального пакета:
1. Переведено на русский язык.
2. Отредактированы и дополнены комментарии к функциям.
3. Исправлены некоторые ошибки запуска и т.д.
4. Отправка ярлыков на Рабочий стол.
5. Запуск с выбором языка с помощью (ярлыка) лаунчера на рабочем столе или через директорию пакета.
6. Файлы запуска скомпилированы в привычные *exe.
7. Окно команд запускается в свёрнутом виде. PS: совсем прятать его не стал т.к. более точная и подробная информация о процессе наблюдается именно в нём.
8. Внедрены иконки для файлов запуска.
Возможности:
1. Обучение голоса |инструмента|, получение его модели.
2. Разделение вокала-инструментала любыми доступными, как и UVR, моделями.
3. Замена голоса |инструмента| обученным (клонированным) голосом |инструментом|.
4. Замена голоса |инструмента| в реальном времени.
Скриншоты
Скриншот страницы на GitHub с номером версии
Download
Rutracker.org не распространяет и не хранит электронные версии произведений, а лишь предоставляет доступ к создаваемому пользователями каталогу ссылок на торрент-файлы, которые содержат только списки хеш-сумм
Как скачивать? (для скачивания .torrent файлов необходима регистрация)
[Профиль]  [ЛС] 

samir915

Стаж: 14 лет 9 месяцев

Сообщений: 88


samir915 · 18-Мар-24 23:04 (спустя 1 день)

AI захватывает всё больше областей искусства. И это реально страшно.
[Профиль]  [ЛС] 

Lexa1988-L1

Moderator gray

Стаж: 14 лет 4 месяца

Сообщений: 3288

Lexa1988-L1 · 19-Мар-24 09:42 (спустя 10 часов)

Спасибо за локальную версию, надоели пляски с коллабом и прочими инструментами. Попробуем.
[Профиль]  [ЛС] 

adess

Лауреат музыкального конкурса

Стаж: 17 лет 11 месяцев

Сообщений: 321

adess · 19-Мар-24 17:32 (спустя 7 часов)

Есть существенная качественная разница между тем же изотоп rx?)
[Профиль]  [ЛС] 

samsara

Стаж: 17 лет 8 месяцев

Сообщений: 271

samsara · 19-Мар-24 19:24 (спустя 1 час 52 мин.)

Мужики, подскажите, а что это значит - "Для запуска пакета используется CMD \ Python."? ...т.е. запускать RVC 2 Ru.exe от имени Администратора? Или я что-то не понимаю?
[Профиль]  [ЛС] 

Dimitry-Z

Стаж: 14 лет 10 месяцев

Сообщений: 48

Dimitry-Z · 19-Мар-24 20:55 (спустя 1 час 31 мин., ред. 19-Мар-24 21:03)

adess писал(а):
86033163Есть существенная качественная разница между тем же изотоп rx?)
Зависит от используемой модели, но вообще, да, RX так не сможет. Если интересует именно разделение вокала и инструментов, я бы посоветовал обратить внимание на UVR. В RVC это тоже можно делать, но в той раздаче уже собраны отличные модели, плюс сама оболочка под разделение заточена. Если не охота качать 30 ГБ, оболочку можно взять с их GitHub, а модели дозагрузить уже из неё. А RVC, помимо разделения, позволяет создавать собственные модели голосов/инструментов (или подключать готовые) и менять ими другие аудиофайлы.
samsara писал(а):
86033628Мужики, подскажите, а что это значит - "Для запуска пакета используется CMD \ Python."? ...т.е. запускать RVC 2 Ru.exe от имени Администратора? Или я что-то не понимаю?
Для запуска можно использовать либо "RVC 2.exe" (откроется меню), либо любой из необходимых RVC-экзешников (например, "RVC 2 Ru.exe" — откроется сразу RVC с русской локализацией). А Python там внутри живёт и делает всю магию
[Профиль]  [ЛС] 

LARRIUS

Стаж: 14 лет 8 месяцев

Сообщений: 94


LARRIUS · 20-Мар-24 02:24 (спустя 5 часов)

Скажите пожалуйста, а что насчет тренировки моделей с русским языком, есть ли акцент в получаемых моделях? В коллабе находил блокноты с претрейном Snowie, который для русских голосовых моделей лучше.
[Профиль]  [ЛС] 

Lexa1988-L1

Moderator gray

Стаж: 14 лет 4 месяца

Сообщений: 3288

Lexa1988-L1 · 20-Мар-24 10:41 (спустя 8 часов)

LARRIUS писал(а):
86034894Скажите пожалуйста, а что насчет тренировки моделей с русским языком, есть ли акцент в получаемых моделях? В коллабе находил блокноты с претрейном Snowie, который для русских голосовых моделей лучше.
Тоже было интересно насчет этого претрейна, везде пишут о нем, но сам еще не использовал.
[Профиль]  [ЛС] 

sasha_and_lena

Стаж: 15 лет 10 месяцев

Сообщений: 96

sasha_and_lena · 20-Мар-24 15:55 (спустя 5 часов)

LARRIUS писал(а):
86034894Скажите пожалуйста, а что насчет тренировки моделей с русским языком, есть ли акцент в получаемых моделях? В коллабе находил блокноты с претрейном Snowie, который для русских голосовых моделей лучше.
Да. Акцент имеется. Не постоянно, но частенько вылазит.
[Профиль]  [ЛС] 

x86-64

Moderator senior

Стаж: 6 лет 5 месяцев

Сообщений: 24132

x86-64 · 20-Мар-24 18:24 (спустя 2 часа 29 мин.)

Dimitry-Z
Цитата:
В заглавии раздачи должны быть указаны только название, номер версии и язык программы. Все остальные сведения — в описании.
Категорически и всегда запрещена раздача:
многотомных архивов;
[Профиль]  [ЛС] 

Dimitry-Z

Стаж: 14 лет 10 месяцев

Сообщений: 48

Dimitry-Z · 21-Мар-24 00:03 (спустя 5 часов, ред. 21-Мар-24 00:03)

LARRIUS писал(а):
86034894Скажите пожалуйста, а что насчет тренировки моделей с русским языком, есть ли акцент в получаемых моделях? В коллабе находил блокноты с претрейном Snowie, который для русских голосовых моделей лучше.
Из того, что пробовал я, акцент был. Возможно, у меня были не самые удачные модели, но другие не попадались.
x86-64 писал(а):
86037227Dimitry-Z
Цитата:
В заглавии раздачи должны быть указаны только название, номер версии и язык программы. Все остальные сведения — в описании.
Категорически и всегда запрещена раздача:
многотомных архивов;
Заголовок поправил, но остаётся вопрос: как быть с файлами? Можно оставить статус "недооформлено", чтобы скачавшим не приходилось перекачивать?
[Профиль]  [ЛС] 

x86-64

Moderator senior

Стаж: 6 лет 5 месяцев

Сообщений: 24132

x86-64 · 21-Мар-24 00:08 (спустя 4 мин., ред. 21-Мар-24 00:08)

Dimitry-Z писал(а):
86038678как быть с файлами?
Прочтите пункт правил про архивы, после чего либо создайте единый архив, либо распакуйте его.
[Профиль]  [ЛС] 

Lexa1988-L1

Moderator gray

Стаж: 14 лет 4 месяца

Сообщений: 3288

Lexa1988-L1 · 21-Мар-24 10:03 (спустя 9 часов)

Dimitry-Z
Подскажите, какие нужны настройки для тренировки голоса разговорного, для озвучивания реплик и какие для вокала на основе песен, соотвественно чтобы готовая модель могла также петь. Читал, что немного они отличаются. Может под спойлер добавить описание кнопкой и функиций, настройек для того или иного действия, чтобы было понятно, что какая дает, и какими настройками нужно пользоваться.
[Профиль]  [ЛС] 

Tirminater

Стаж: 16 лет 2 месяца

Сообщений: 6


Tirminater · 21-Мар-24 15:53 (спустя 5 часов)

Закрыто((((( Где то можно ещё скачать?
[Профиль]  [ЛС] 

Dimitry-Z

Стаж: 14 лет 10 месяцев

Сообщений: 48

Dimitry-Z · 24-Мар-24 13:52 (спустя 2 дня 21 час, ред. 24-Мар-24 13:52)

Lexa1988-L1 писал(а):
86039600Dimitry-Z
Подскажите, какие нужны настройки для тренировки голоса разговорного, для озвучивания реплик и какие для вокала на основе песен, соотвественно чтобы готовая модель могла также петь. Читал, что немного они отличаются. Может под спойлер добавить описание кнопкой и функиций, настройек для того или иного действия, чтобы было понятно, что какая дает, и какими настройками нужно пользоваться.
Основная настройка, которая отвечает за певческий/дикторский голос, касается изменения высоты тона: "Будет ли модель голоса поддерживать изменение высоты тона?". Второе, что теоретически можно поменять при обучении — базовые модели генератора и дискриминатора ("G" и "D"), но я не занимался поисками других и использовал только те, что присутствуют в данном пакете. Это что касается обучения модели. Если модель уже готова, то наиболее частая проблема, с которой приходится сталкиваться при изменении голоса — необходимость коррекции высоты голоса. Остальные параметры, типа микширования голосов, защиты согласных и коэффициента поиска тональности, стоит подбирать уже применительно к вашему аудиоматериалу для более тонкой настройки. Важно ещё учесть, что, так как нейронка работает через распознавание, на плохих записях возможны артефакты.
Tirminater писал(а):
86040866Закрыто((((( Где то можно ещё скачать?
Мне не удалось убедить модератора в том, что переделывать раздачу — плохая идея. Если всё будет хорошо, сегодня обновлю и можно будет опять скачивать.
[Профиль]  [ЛС] 

LARRIUS

Стаж: 14 лет 8 месяцев

Сообщений: 94


LARRIUS · 27-Мар-24 16:28 (спустя 3 дня)

Lexa1988-L1 писал(а):
86035666
LARRIUS писал(а):
86034894Скажите пожалуйста, а что насчет тренировки моделей с русским языком, есть ли акцент в получаемых моделях? В коллабе находил блокноты с претрейном Snowie, который для русских голосовых моделей лучше.
Тоже было интересно насчет этого претрейна, везде пишут о нем, но сам еще не использовал.
Онлайн в гугл коллабе использовал, заметно меньше акцента, вот теперь ищу офлайн возможность, так как комп позволяет быстро делать тренировку.
[Профиль]  [ЛС] 

Rus.sak

Стаж: 15 лет 4 месяца

Сообщений: 179


Rus.sak · 29-Мар-24 20:45 (спустя 2 дня 4 часа, ред. 29-Мар-24 20:45)

LARRIUS
Lexa1988-L1
Претрейны от снежка (не в обиду ему) не сильно меняют положение в плане акцента, но тембр совершенно другой, так и не решил для себя лучше или хуже!
Необходимо указать путь в форке до модели (snowie) в путях для претрейнов, включая её название и расширение...
Но это немного не для этой версии RVC, раз вы задаёте такие вопросы, значит можно делать раздачи пакетов под кастомные претрейны!
Если Dimitry-Z не затруднит зделать ещё 2 раздачи, то скоро будут те версии которые поддерживают кастомные претрейны.
Lexa1988-L1 писал(а):
86039600Dimitry-Z
Подскажите, какие нужны настройки для тренировки голоса разговорного, для озвучивания реплик и какие для вокала на основе песен, соотвественно чтобы готовая модель могла также петь. Читал, что немного они отличаются. Может под спойлер добавить описание кнопкой и функиций, настройек для того или иного действия, чтобы было понятно, что какая дает, и какими настройками нужно пользоваться.
Та модель, которая умеет петь, умеет и читать. Та модель, которая умеет читать, не умеет петь, т.е будут сильные искажения по питчу т.к она при обучении не учитывала изменение тона...
Специально переводил максимально дословно и даже дополнял перевод заглядывая в будущее... специально для одарённых по нечитаемости, да да зная что читать даже коротенькие (но полностью объясняющие суть) аннотации к функциям мало кто будет )) а зря.
[Профиль]  [ЛС] 

AssassinMaks

Стаж: 14 лет 1 месяц

Сообщений: 14


AssassinMaks · 17-Апр-24 22:28 (спустя 19 дней)

Не могу распаковать архив. Ни winRar, ни 7zip не может.
Ошибка в 4 файлах.
"Неподдерживаемый метод сжатия" t64-arm.exe w64-arm.exe cli-arm64.exe gui-arm64.exe
[Профиль]  [ЛС] 

red3ninja

Стаж: 10 лет 1 месяц

Сообщений: 3


red3ninja · 01-Май-24 10:22 (спустя 13 дней)

AssassinMaks писал(а):
86152515Не могу распаковать архив. Ни winRar, ни 7zip не может.
Ошибка в 4 файлах.
"Неподдерживаемый метод сжатия" t64-arm.exe w64-arm.exe cli-arm64.exe gui-arm64.exe
Попробуйте остановить антивирус.
Или загрузите файлы .bat с GitHub.
[Профиль]  [ЛС] 

Klim-Shady

Стаж: 14 лет 9 месяцев

Сообщений: 215

Klim-Shady · 01-Май-24 23:46 (спустя 13 часов)

Скачал, распаковал, запустил - не работает, закинул модель в папку, нажал обновить список моделей, пошёл не прекращаемый отсчёт времени слева и всё, тоже самое с переводом голоса, нажимаю преобразовать и всё, идёт отсчёт времени бесконечный -результата 0, ждал пол часа потом закрыл браузер. Выбрал язык английский, почему-то всё равно всё на руском. Другие локальные РВС стыреные с интернета работают отлично. У кого с этой раздачи завелось?
[Профиль]  [ЛС] 

burdalak1

Стаж: 13 лет 7 месяцев

Сообщений: 139

burdalak1 · 12-Май-24 01:56 (спустя 10 дней)

Вот при обучении модели можно указывать Полное количество эпох: (выбранное число указывает на количество проходов обучения до создания конечной модели в виде *pth и *index) По умолчанию стоит 20, это хороший показатель? или качество зависит от исходника по которому оно обучается? Просто я сделал на 20 и офонарел от качества, думал будет плохо, все таки за 30 мин обучил. А ведь можно еще выбрать количество 1000, что тогда получится?)
[Профиль]  [ЛС] 

sasha_and_lena

Стаж: 15 лет 10 месяцев

Сообщений: 96

sasha_and_lena · 12-Май-24 06:45 (спустя 4 часа)

burdalak1
В роликах, что я смотрел на ютубе о RVC, советуют ставить от 200 до 300 эпох. Для самого оптимального обучения. Я так и ставлю, 250 - 300.
[Профиль]  [ЛС] 

red3ninja

Стаж: 10 лет 1 месяц

Сообщений: 3


red3ninja · 29-Май-24 18:56 (спустя 17 дней, ред. 29-Май-24 18:56)

У меня хорошие результаты с 100 эпох и набором dataset за полторы минуты. Все зависит от качества звука и желаемого результата. Я использую Snowie_V3.1
Попробуйте этот голос... Там 50 эпох: https://cloud.mail.ru/public/7pgP/kWheJbVrH
[Профиль]  [ЛС] 

Ранеткус

Стаж: 12 лет 5 месяцев

Сообщений: 80


Ранеткус · 08-Июн-24 13:44 (спустя 9 дней, ред. 08-Июн-24 13:44)

red3ninja писал(а):
86320312У меня хорошие результаты с 100 эпох и набором dataset за полторы минуты. Все зависит от качества звука и желаемого результата. Я использую Snowie_V3.1
Попробуйте этот голос... Там 50 эпох: https://cloud.mail.ru/public/7pgP/kWheJbVrH
Прослушать не удалось-ссылка не рабочая!!! Обучил голос с помощью Snowie_V3.1(D_SnowieV3.1_JP_hubert.pth, G_SnowieV3.1_JP_hubert.pth) результат остался тот же, произношение "Р" "КАР" - нужен логопед ! Много перепробовал разных вариантов и количеств эпох - нужен наш родной славянский датасет!!!
[Профиль]  [ЛС] 

red3ninja

Стаж: 10 лет 1 месяц

Сообщений: 3


red3ninja · 19-Июн-24 07:39 (спустя 10 дней, ред. 19-Июн-24 07:39)

Ранеткус писал(а):
86354349
red3ninja писал(а):
86320312У меня хорошие результаты с 100 эпох и набором dataset за полторы минуты. Все зависит от качества звука и желаемого результата. Я использую Snowie_V3.1
Попробуйте этот голос... Там 50 эпох: https://cloud.mail.ru/public/7pgP/kWheJbVrH
Прослушать не удалось-ссылка не рабочая!!! Обучил голос с помощью Snowie_V3.1(D_SnowieV3.1_JP_hubert.pth, G_SnowieV3.1_JP_hubert.pth) результат остался тот же, произношение "Р" "КАР" - нужен логопед ! Много перепробовал разных вариантов и количеств эпох - нужен наш родной славянский датасет!!!
Edit: https://cloud.mail.ru/public/fto2/sGNQ7iiEu
Я активировал его на 3 месяца.
Думаю, это еще зависит от качества звука. Получите образец голоса от Storytel.
[Профиль]  [ЛС] 

nastya.beam

Стаж: 7 лет 8 месяцев

Сообщений: 11

nastya.beam · 15-Июл-24 12:42 (спустя 26 дней)

samir915 писал(а):
86030731AI захватывает всё больше областей искусства. И это реально страшно.
ничего страшного не вижу совершенно, теперь я могу заменить свой противный голос на голос Evanescence
[Профиль]  [ЛС] 

king2662

Стаж: 14 лет 8 месяцев

Сообщений: 357


king2662 · 05-Сен-24 19:26 (спустя 1 месяц 21 день)

у меня такой вопрос к уважаемым знатокам этого дела....У меня почему то при замене голоса, на звуках Ч, Ш, Щ, Ц и иногда на С слышится какой то неприятный призвук, как будто маленькая частота дискретицации. Кто нибудь замечал такое?
Вроде тренирую голоса на хороших качественных записях, голос который заменяю тоже качественно записан. Может что то в настройках покрутить надо ? При замене голоса обычно все настройки по дефолт стоят, меняю только алгоритм извлечения на rmvpe.
[Профиль]  [ЛС] 

Kesovord

Стаж: 6 месяцев

Сообщений: 24

Kesovord · 13-Сен-24 08:22 (спустя 7 дней)

Есть вариант получше этого? Специально под карты RTX 20
[Профиль]  [ЛС] 

alex_zxa

Стаж: 13 лет 3 месяца

Сообщений: 555


alex_zxa · 23-Сен-24 08:51 (спустя 10 дней)

В какой программе можно сделать такое?
"Искусственный Интеллект озвучивает знаменитостей их же голосом НО на русском" Хотел бы я перевести какую-нибудь песню Битлз на русский, и чтоб ее спел голос Маккартни... по-русски без акцента
[Профиль]  [ЛС] 

Rus.sak

Стаж: 15 лет 4 месяца

Сообщений: 179


Rus.sak · 08-Окт-24 21:32 (спустя 15 дней)

king2662
Первый скриншот. Защитить глухие согласные и звуки дыхания от артефактов ....
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error