MrNekitoshka · 03-Окт-23 16:33(1 год 1 месяц назад, ред. 25-Окт-23 01:32)
Ultimate Vocal Remover Год/Дата Выпуска: 2023 Версия: v5.6.0 Разработчик: Core Developers: Anjok07, aufr33 Сайт разработчика: GitHub Репак : Dr. Badan (ANtoNNN1) Разрядность: 64bit Язык интерфейса: Английский Таблэтка: не требуется Системные требования: Windows 10, 11 64bit Описание: Программа является оболочкой для моделей нейронных сетей, созданных для работы с миксом и извлечения из него аудиодорожек. Программа извлекает вокал из микса, а так же разделяет микс на дорожки (барабанная секция, басс, клавиши, вокал, гитара и т.д.). Функция разделения на несколько дорожек доступна в моделях Demucs. Доп. информация: Относительно этой раздачи: обновлено само приложение, включено больше моделей (в т.ч. "VIP модели").
Не уходите с раздачи, пожалуйста. Образ большой, один не раздам... Интернет 100мбит/c, через пару часов раздача "укоренится", и скорость появится у всех.
У кого вопросы по репаку будут, пишите, делал я его для себя, поэтому описания для каждой модели не будет (это целую книгу писать нужно, поэтому гуглите, но точечно о какой-то модели по запросу расскажу). Так вроде проверял на 5 машинах, все работает. Тут есть некоторые модельки в папке Demucs_Models\v3_v4_repo они пока не работают (83fc094f-4a16d450, 5d2d6c55-db83574e и тд). Так то они рабочие, но для них нужен свой yaml. Эти модели сделаны для удаления шумов с голоса, дереверб и разделение на несколько голосов речь. Человек, который создавал модели, уже месяц не выходит на связь, так что как только объявится, я залью на облако yaml (просто добавите его в папки с моделями) и все заработает. Оставил их потому, что они обещают быть покруче того, что сейчас там есть. Хотя, разделение голосов и шумовые редакшены вполне хороши, это уже для тех, кто любит придираться (как я). Обратите внимание на модель MDX23C (там их две). Это по сути улучшенная версия четвертого demucs. Она пока что не делит в отличии demucs трек на шесть дорожек, но зато умеет получше demucs отделять вокал и отлично чистит голосовые дорожки. Идеально, если записывали интервью в машине или с кучей бэкграундных шумов, чистит просто супер, причем сохраняет нижние обертона голоса, прям магия какая-то. по прежнему ВСЕ модели сложно справляются с разделением, если в треке есть фазовые проблемы. Поэтому, если есть возможность поправить фазу, то правьте и только потом закидывайте на разделение. Пробуйте новую функцию Spectral Inversion, но она не панацея. ВАЖНО! Алгоритмы demucs и MDX во много раз превосходят izotope и т.п. разделялки, которые есть на рынке. Все они используют устаревшую модель Spleeter. Устарела она на несколько лет и не обновляется никак. Из нее пытаются выжать все соки, но дотянуть до моделей, которые есть тут, уже невозможно (во-первых, тут дата сэт больше и лучше и эти модели развиваются, а не стоят на месте, в отличии от софта со Spleeter, который развивается только в сторону механики воздействия на саму модель и все). У некоторых возникнет вопрос (скорее всего) зачем это на трекере, ведь сама прога Ultimate Vocal Remover в открытом доступе и с открытым кодом на github лежит. Отвечу - тут дело не в программе, а в моделях. Во-первых, это единственная адекватная оболочка для работы с ними, во-вторых, многие стали очень некрасиво поступать, брать модели, которые изначально создавались для открытого доступа, связываться с разрабами и предлагать им деньги, чтобы они убрали модель с открытого доступа, а сами делают различные интернет сервисы за которые берут деньги и требуют подписку. Наверняка вы уже встречались с такими сайтами. ВСЕ ЧТО ОНИ ПРЕДЛАГАЮТ ПЛАТНО - тут есть. В этом репаке я собрал все ЛУЧШИЕ модели, некоторые из которых вы уже не найдете в открытом доступе (легально). Здесь 171 модель для разделения музыки и вообще под все возможные нужды (включая утилиты). Только одни модели весят 24,5 гигабайта (в отличии от стандарта Ultimate Vocal Remover, который поставляется всего с 3 гб моделей. Разница, думаю, понятна. Для тех, кто хочет поэкспериментировать с разделением вокала на лид вокал и бэк вокал или разделить речь двух -трех людей, то вам нужно лезть в настройки и юзать раздел vocal Splitter Options, он отдельный для MDX и демукса. Там же включается DeReverb для каждого вокала (можно оставить, к примеру, лид вокал с реверберацией, а бэки без реверба) это новая фишка, в старой раздаче ее нету. По многим вопросам я отвечал в коментах вот тут - https://rutr.life/forum/viewtopic.php?t=6299232 , поэтому прежде чем задавать, почитайте ветку коментов.
В предыдущей теме упоминались WIP модели, из которых я нашёл только работающую с пианино: VR > WIP Piano . Как называются остальные? И много ли их, "особенных", работающих с определёнными инструментами? Кроме demucs_v4_6s
Цитата:
Среди VIP моделей, к примеру, модель удаляющая только пианино или выдергивающая только духовые и т.п.
В предыдущей теме упоминались WIP модели, из которых я нашёл только работающую с пианино: VR > WIP Piano . Как называются остальные? И много ли их, "особенных", работающих с определёнными инструментами? Кроме demucs_v4_6s
Цитата:
Среди VIP моделей, к примеру, модель удаляющая только пианино или выдергивающая только духовые и т.п.
Тех отдельных тут нет, проект на гитхабе заглох (которые выдергивали эти модельки), как и проект по разделению барабанных дорожек. Тут только самые лучшие на сегодняшний день, которые только можно достать. Сейчас только один китаец пытается что-то делать, но очень медленно. Естественно, я помню об этом еще с прошлой ветке и как только заполучу эти модели, сразу выложу.
85282451Обратите внимание на модель MDX23C (там их две)
а у меня что-то лишь одна: MDX23C_В1581.ckpt
В принципе, можно и эту версию оставить в свете возможного появления дополнительных моделей, для которых
Цитата:
нужен свой yaml
Но в целом, как я понял, тут просто выложены все модели, включая их первые версии и беты. Т.е. при наличии более совершенных версий тех же моделей, их старые версии ни к чему, только пакет занимает в 2 раза больше места.
А вот какие файлы нужно скопировать в старый пакет, чтобы была модель "VR Arch. / WIP-Piano...", которой ранее не было в доступе? Вероятно, достаточно собственно WIP-Piano-4band-129605kb.pth
неплохо, но я встречал получше разработки на gitHub. Здесь на гласных слышен... какой-то песочек цифровой. Вообще, поищите модели для RVC-GUI. Вы сами можете напеть в микрофон, поправить жестко мелодайном и пропустить через RVC, выбрав, к примеру, модель голоса Басты или Луи Армстронга и т.п. Если хорошую модель найдете (а их уже тысячи), то отличий почти не будет, нужно только ручками поработать с настройками.
+Paolo+ писал(а):
85284789
ANtoNNN1 писал(а):
85282451Обратите внимание на модель MDX23C (там их две)
а у меня что-то лишь одна: MDX23C_В1581.ckpt
В принципе, можно и эту версию оставить в свете возможного появления дополнительных моделей, для которых
Цитата:
нужен свой yaml
Но в целом, как я понял, тут просто выложены все модели, включая их первые версии и беты. Т.е. при наличии более совершенных версий тех же моделей, их старые версии ни к чему, только пакет занимает в 2 раза больше места.
А вот какие файлы нужно скопировать в старый пакет, чтобы была модель "VR Arch. / WIP-Piano...", которой ранее не было в доступе? Вероятно, достаточно собственно WIP-Piano-4band-129605kb.pth
Ну, из старой раздачи тут все модели есть, я ничего не убирал. А что до MDX23C то там две модели, MDX23C-8KFFT-InstVoc_HQ и MDX23C_D1581 датасэт один, но они отличаются друг от друга
Интерес вызвала не главная фича как то отделение вокала от всего остального а возможность разделять на другие состовляющие микс. Вопрос к раздающему как к юзающиму данный софт. А как с разделением на бас, гитары, клавиши, барабаны и т.д. Справлется? И как справляется? Насколько чисто?
85286715Интерес вызвала не главная фича как то отделение вокала от всего остального а возможность разделять на другие состовляющие микс. Вопрос к раздающему как к юзающиму данный софт. А как с разделением на бас, гитары, клавиши, барабаны и т.д. Справлется? И как справляется? Насколько чисто?
По разному, как я уже говорил, если есть фазовые проблемы, то разделяет прьблемно, но в 80% случаев все работает очень хороошо
+Paolo+ писал(а):
85287763
ANtoNNN1 писал(а):
85286519то там две модели, MDX23C-8KFFT-InstVoc_HQ и MDX23C_D1581 датасэт один, но они отличаются друг от друга
Наверно, проблема у меня в видяхе или ещё каком-то сегменте. Но выглядит так:
Если на борту меньше 12 гб, то да, могут быть проблемы (так разраб пишет). У меня вот так -
enmobba писал(а):
85287885Прошу прощения за вопрос, в процессе перехода на 10-ку, но пока на 7й. На Вин7 есть вариант запустить программу?
На ноуте запустилась, но у меня там нет крутой видеокарты, поэтому протестить в полном объеме не могу. Но, оболочка запускается, дальше только вопрос к видеокарте
85290994У меня так-же после установки не было MDX23C-8KFFT-InstVoc_HQ. Эту модель спокойно можно докачать в центре загрузок (в настройках)
точняк!
значит, её почему-то не было в раздаче. ну, бывает)) (одна модель в раздаче, наоборот, два раза скопирована, в VR Arch.: HP_KAROKEE...124m)
спасибо за подсказку! интересно, на сайте mvsep.ком предлагают разделение гитар - это такими же моделями замутили? и если да, то как можно разделить гитарные соло (электро) и подклад (акустика)?
Не могу понять, что за параметр OVERLAP, и как его правильно выставлять. В инструкции написано "эта опция контролирует величину перекрытия между окнами предсказания". Это что, по типу LOOKAHEAD у компрессора? Непонятно. И как его выставлять? Как он влияет на результат?
Модель MDX23C_D1581 уже есть здесь в сборке , докачать надо MDX23C-InstVoc HQ это и есть MDX23C-8KFFT-InstVoc_HQ Ребята может кто растолкует как подключить GPU AMD , вот здесь (https://github.com/Aloereed/ultimatevocalremovergui-directml) вроде инструкция , но ничего не понял.
85305122Модель MDX23C_D1581 уже есть здесь в сборке , докачать надо MDX23C-InstVoc HQ это и есть MDX23C-8KFFT-InstVoc_HQ Ребята может кто растолкует как подключить GPU AMD , вот здесь (https://github.com/Aloereed/ultimatevocalremovergui-directml) вроде инструкция , но ничего не понял.
Если программирование не знаешь, то никак. Там Setup описывается с учетом, что у тебя питон стоит и гитхаб, ты клонируешь код и запускаешь его у себя.
Мне интересна упомянутая функция dereverb и что якобы она очень качественно чистит, лучше чем iZotope. То есть я могу убрать выборочно отражения комнаты, в которой проводилась запись голоса, или настроек, как таковых нет и просто убираются хвосты?