Dimitry-Z · 17-Мар-24 22:06(7 месяцев назад, ред. 07-Апр-24 12:34)
RVC 2 (1006v2) (Retrieval Based Voice Conversion) [WebUI + RT] Сборка от Rus.sak Год выпуска: 2023 Версия: 2 (1006v2) Разработчик: RVC-Project Сайт разработчика: GitHub Автор сборки: Rus.sak Разрядность: 64bit Язык интерфейса: Английский + Русский Таблэтка: не требуется Системные требования: Windows 10, 11; Видеокарта Nvidia (новых поколений, желательно с не менее 8 ГБ VRAM) Описание: Основанный на VITS фреймворк, объединяющий в себе инструменты для изменения голоса, разделения вокала и аккомпанемента, обучения голосовых моделей и работы с файлами моделей. Функционал разделения поддерживает работу с моделями UVR. Внимание! Во всех путях и названиях файлов (при установке и во время работы) избегаем пробелов и кириллицы! Ряд связанных с данным инструментом вопросов обсуждался в комментариях к раздаче UVR. 2024-03-24. Раздача обновлена по требованию модератора x86-64. Просьба перекачать торрент.
Отличие от других источников:
1.Переименованны для правильного восприятия/убрана кириллица, которая может стать причиной неработоспособности модели.
2.Отсортированны по алфавиту/по папкам.
3.Оставленны только рабочие, и имеющие файл индекса, без которого использование модели невозможно.
4.Модели с иностранным исполнителем/персонажем в разделе RU, говорит о голосе русскоязычного диктора, который перевёл данного исполнителя/персонажа и с которого была обучена модель.
5.Русскоязычные модели отобраны по принципу «без акцента, картавости и искажений».
Установка модели:
Перетащить модель.zip в соответствующее окно запущенного приложения, которое самостоятельно распакует zip в нужную директорию, либо разархивировать и поместить папку с моделью в корень приложения - weights.
1. Распаковать архив. Путь (названия папок) не должен содержать пробелов и кириллицы.
2. Запустить файл "RVC 2.exe" (также можно использовать "RVC 2 Ru.exe", "RVC 2 En.exe" или "RVC 2 Realtime.exe" для запуска необходимого продукта без захода в меню).
3. При запуске необходимо разрешить доступ (поставив "галочку") к домашней (локальной) сети, для того чтобы оболочка WebUI могла взаимодействовать с вашим жёстким диском (чтение и запись подопытных файлов)-(работа в офлайн); если будет необходимость скачивать модели через оболочку, то необходимо разрешить так же доступ в общественную сеть (работа офлайн + онлайн).
Дополнительная информация
Инфо: Пакет состоит из двух составляющих: RVC-WebUI (разделение, обучение, конвертация и т.д.) и SVC-RealTime (замена голоса в реальном времени.) 1. Для запуска пакета используется CMD \ Python.
2. Установка Python не требуется т.к. он уже предустановлен в пакет.
3. В качестве оболочки (графического интерфейса WebUI) пакета используется браузер.
4. Процесс действий и статус их выполнений прослеживается через свёрнутое окно команд.
5. Первый запуск происходит достаточно долго.
6. Разрешается запуск только одного экземпляра подобных пакетов одновременно.
7. По завершению работы не забываем закрывать окно команд! Отличие от оригинального пакета: 1. Переведено на русский язык.
2. Отредактированы и дополнены комментарии к функциям.
3. Исправлены некоторые ошибки запуска и т.д.
4. Отправка ярлыков на Рабочий стол.
5. Запуск с выбором языка с помощью (ярлыка) лаунчера на рабочем столе или через директорию пакета.
6. Файлы запуска скомпилированы в привычные *exe.
7. Окно команд запускается в свёрнутом виде. PS: совсем прятать его не стал т.к. более точная и подробная информация о процессе наблюдается именно в нём.
8. Внедрены иконки для файлов запуска. Возможности: 1. Обучение голоса |инструмента|, получение его модели.
2. Разделение вокала-инструментала любыми доступными, как и UVR, моделями.
3. Замена голоса |инструмента| обученным (клонированным) голосом |инструментом|.
4. Замена голоса |инструмента| в реальном времени.
Мужики, подскажите, а что это значит - "Для запуска пакета используется CMD \ Python."? ...т.е. запускать RVC 2 Ru.exe от имени Администратора? Или я что-то не понимаю?
86033163Есть существенная качественная разница между тем же изотоп rx?)
Зависит от используемой модели, но вообще, да, RX так не сможет. Если интересует именно разделение вокала и инструментов, я бы посоветовал обратить внимание на UVR. В RVC это тоже можно делать, но в той раздаче уже собраны отличные модели, плюс сама оболочка под разделение заточена. Если не охота качать 30 ГБ, оболочку можно взять с их GitHub, а модели дозагрузить уже из неё. А RVC, помимо разделения, позволяет создавать собственные модели голосов/инструментов (или подключать готовые) и менять ими другие аудиофайлы.
samsara писал(а):
86033628Мужики, подскажите, а что это значит - "Для запуска пакета используется CMD \ Python."? ...т.е. запускать RVC 2 Ru.exe от имени Администратора? Или я что-то не понимаю?
Для запуска можно использовать либо "RVC 2.exe" (откроется меню), либо любой из необходимых RVC-экзешников (например, "RVC 2 Ru.exe" — откроется сразу RVC с русской локализацией). А Python там внутри живёт и делает всю магию
Скажите пожалуйста, а что насчет тренировки моделей с русским языком, есть ли акцент в получаемых моделях? В коллабе находил блокноты с претрейном Snowie, который для русских голосовых моделей лучше.
86034894Скажите пожалуйста, а что насчет тренировки моделей с русским языком, есть ли акцент в получаемых моделях? В коллабе находил блокноты с претрейном Snowie, который для русских голосовых моделей лучше.
Тоже было интересно насчет этого претрейна, везде пишут о нем, но сам еще не использовал.
86034894Скажите пожалуйста, а что насчет тренировки моделей с русским языком, есть ли акцент в получаемых моделях? В коллабе находил блокноты с претрейном Snowie, который для русских голосовых моделей лучше.
Да. Акцент имеется. Не постоянно, но частенько вылазит.
В заглавии раздачи должны быть указаны только название, номер версии и язык программы. Все остальные сведения — в описании. Категорически и всегда запрещена раздача:
многотомных архивов;
86034894Скажите пожалуйста, а что насчет тренировки моделей с русским языком, есть ли акцент в получаемых моделях? В коллабе находил блокноты с претрейном Snowie, который для русских голосовых моделей лучше.
Из того, что пробовал я, акцент был. Возможно, у меня были не самые удачные модели, но другие не попадались.
x86-64 писал(а):
86037227Dimitry-Z
Цитата:
В заглавии раздачи должны быть указаны только название, номер версии и язык программы. Все остальные сведения — в описании. Категорически и всегда запрещена раздача:
многотомных архивов;
Заголовок поправил, но остаётся вопрос: как быть с файлами? Можно оставить статус "недооформлено", чтобы скачавшим не приходилось перекачивать?
Dimitry-Z
Подскажите, какие нужны настройки для тренировки голоса разговорного, для озвучивания реплик и какие для вокала на основе песен, соотвественно чтобы готовая модель могла также петь. Читал, что немного они отличаются. Может под спойлер добавить описание кнопкой и функиций, настройек для того или иного действия, чтобы было понятно, что какая дает, и какими настройками нужно пользоваться.
86039600Dimitry-Z
Подскажите, какие нужны настройки для тренировки голоса разговорного, для озвучивания реплик и какие для вокала на основе песен, соотвественно чтобы готовая модель могла также петь. Читал, что немного они отличаются. Может под спойлер добавить описание кнопкой и функиций, настройек для того или иного действия, чтобы было понятно, что какая дает, и какими настройками нужно пользоваться.
Основная настройка, которая отвечает за певческий/дикторский голос, касается изменения высоты тона: "Будет ли модель голоса поддерживать изменение высоты тона?". Второе, что теоретически можно поменять при обучении — базовые модели генератора и дискриминатора ("G" и "D"), но я не занимался поисками других и использовал только те, что присутствуют в данном пакете. Это что касается обучения модели. Если модель уже готова, то наиболее частая проблема, с которой приходится сталкиваться при изменении голоса — необходимость коррекции высоты голоса. Остальные параметры, типа микширования голосов, защиты согласных и коэффициента поиска тональности, стоит подбирать уже применительно к вашему аудиоматериалу для более тонкой настройки. Важно ещё учесть, что, так как нейронка работает через распознавание, на плохих записях возможны артефакты.
Tirminater писал(а):
86040866Закрыто((((( Где то можно ещё скачать?
Мне не удалось убедить модератора в том, что переделывать раздачу — плохая идея. Если всё будет хорошо, сегодня обновлю и можно будет опять скачивать.
86034894Скажите пожалуйста, а что насчет тренировки моделей с русским языком, есть ли акцент в получаемых моделях? В коллабе находил блокноты с претрейном Snowie, который для русских голосовых моделей лучше.
Тоже было интересно насчет этого претрейна, везде пишут о нем, но сам еще не использовал.
Онлайн в гугл коллабе использовал, заметно меньше акцента, вот теперь ищу офлайн возможность, так как комп позволяет быстро делать тренировку.
LARRIUS Lexa1988-L1
Претрейны от снежка (не в обиду ему) не сильно меняют положение в плане акцента, но тембр совершенно другой, так и не решил для себя лучше или хуже!
Необходимо указать путь в форке до модели (snowie) в путях для претрейнов, включая её название и расширение...
Но это немного не для этой версии RVC, раз вы задаёте такие вопросы, значит можно делать раздачи пакетов под кастомные претрейны!
Если Dimitry-Z не затруднит зделать ещё 2 раздачи, то скоро будут те версии которые поддерживают кастомные претрейны.
Lexa1988-L1 писал(а):
86039600Dimitry-Z
Подскажите, какие нужны настройки для тренировки голоса разговорного, для озвучивания реплик и какие для вокала на основе песен, соотвественно чтобы готовая модель могла также петь. Читал, что немного они отличаются. Может под спойлер добавить описание кнопкой и функиций, настройек для того или иного действия, чтобы было понятно, что какая дает, и какими настройками нужно пользоваться.
Та модель, которая умеет петь, умеет и читать. Та модель, которая умеет читать, не умеет петь, т.е будут сильные искажения по питчу т.к она при обучении не учитывала изменение тона...
Специально переводил максимально дословно и даже дополнял перевод заглядывая в будущее... специально для одарённых по нечитаемости, да да зная что читать даже коротенькие (но полностью объясняющие суть) аннотации к функциям мало кто будет )) а зря.
Не могу распаковать архив. Ни winRar, ни 7zip не может.
Ошибка в 4 файлах.
"Неподдерживаемый метод сжатия" t64-arm.exe w64-arm.exe cli-arm64.exe gui-arm64.exe
86152515Не могу распаковать архив. Ни winRar, ни 7zip не может.
Ошибка в 4 файлах.
"Неподдерживаемый метод сжатия" t64-arm.exe w64-arm.exe cli-arm64.exe gui-arm64.exe
Попробуйте остановить антивирус.
Или загрузите файлы .bat с GitHub.
Скачал, распаковал, запустил - не работает, закинул модель в папку, нажал обновить список моделей, пошёл не прекращаемый отсчёт времени слева и всё, тоже самое с переводом голоса, нажимаю преобразовать и всё, идёт отсчёт времени бесконечный -результата 0, ждал пол часа потом закрыл браузер. Выбрал язык английский, почему-то всё равно всё на руском. Другие локальные РВС стыреные с интернета работают отлично. У кого с этой раздачи завелось?
Вот при обучении модели можно указывать Полное количество эпох: (выбранное число указывает на количество проходов обучения до создания конечной модели в виде *pth и *index) По умолчанию стоит 20, это хороший показатель? или качество зависит от исходника по которому оно обучается? Просто я сделал на 20 и офонарел от качества, думал будет плохо, все таки за 30 мин обучил. А ведь можно еще выбрать количество 1000, что тогда получится?)
У меня хорошие результаты с 100 эпох и набором dataset за полторы минуты. Все зависит от качества звука и желаемого результата. Я использую Snowie_V3.1
Попробуйте этот голос... Там 50 эпох: https://cloud.mail.ru/public/7pgP/kWheJbVrH
86320312У меня хорошие результаты с 100 эпох и набором dataset за полторы минуты. Все зависит от качества звука и желаемого результата. Я использую Snowie_V3.1
Попробуйте этот голос... Там 50 эпох: https://cloud.mail.ru/public/7pgP/kWheJbVrH
Прослушать не удалось-ссылка не рабочая!!! Обучил голос с помощью Snowie_V3.1(D_SnowieV3.1_JP_hubert.pth, G_SnowieV3.1_JP_hubert.pth) результат остался тот же, произношение "Р" "КАР" - нужен логопед ! Много перепробовал разных вариантов и количеств эпох - нужен наш родной славянский датасет!!!
86320312У меня хорошие результаты с 100 эпох и набором dataset за полторы минуты. Все зависит от качества звука и желаемого результата. Я использую Snowie_V3.1
Попробуйте этот голос... Там 50 эпох: https://cloud.mail.ru/public/7pgP/kWheJbVrH
Прослушать не удалось-ссылка не рабочая!!! Обучил голос с помощью Snowie_V3.1(D_SnowieV3.1_JP_hubert.pth, G_SnowieV3.1_JP_hubert.pth) результат остался тот же, произношение "Р" "КАР" - нужен логопед ! Много перепробовал разных вариантов и количеств эпох - нужен наш родной славянский датасет!!!
у меня такой вопрос к уважаемым знатокам этого дела....У меня почему то при замене голоса, на звуках Ч, Ш, Щ, Ц и иногда на С слышится какой то неприятный призвук, как будто маленькая частота дискретицации. Кто нибудь замечал такое? Вроде тренирую голоса на хороших качественных записях, голос который заменяю тоже качественно записан. Может что то в настройках покрутить надо ? При замене голоса обычно все настройки по дефолт стоят, меняю только алгоритм извлечения на rmvpe.