Ultimate Vocal Remover GUI v5.5.0 Standalone x64 (Repack by Dr. Badan) [20.12.2022]

Страницы :   Пред.  1, 2, 3 ... 6, 7, 8 ... 13, 14, 15  След.
Ответить
 

FotoTash

Стаж: 5 лет 3 месяца

Сообщений: 710


FotoTash · 31-Янв-23 18:41 (2 года 8 месяцев назад, ред. 31-Янв-23 18:41)

Rus.sak писал(а):
84231393вы либо уже попробовали и убедились в отличных результатах
пробовал, но не убедился, и выложенные файлы не убедили...
думал у вас что-то лучшее получилось, а чтобы точно проверить надо делать все именно на одном материале
и я не ищу подвоха или язвлю, а просто хочу чтобы высказанные устно оценки были проиллюстрированы звуковыми примерами
[Профиль]  [ЛС] 

Rus.sak

Стаж: 16 лет 3 месяца

Сообщений: 371


Rus.sak · 31-Янв-23 20:08 (спустя 1 час 27 мин., ред. 31-Янв-23 20:08)

FotoTash писал(а):
и выложенные файлы не убедили...
Не понял чьи... я ещё ничего не выкладывал Без какой либо обработки...денойза и т.д и т.п. Честно... если бы делал данный минус для себя, то принципиально оставил бы здесь небольшой шумок и не вылизывал бы данную комозицию в ноль (специально для этого изолировал все шипящие диессером для противофазы), и не смотря на неравномерный по продолжительности ревер на ударных, докидывать бы тоже не стал! Короче оставил бы всё как есть.
Результат помоему похож на Ubiquitousabug, но у его результата остался вокальный хвост в конце, а так его результат мне понравился ещё больше!
[Профиль]  [ЛС] 

FotoTash

Стаж: 5 лет 3 месяца

Сообщений: 710


FotoTash · 31-Янв-23 20:51 (спустя 43 мин.)

Rus.sak
мне тоже больше всего понравился вариант от Ubiquitousabug, но это вариант не имеет никакого отношения к этому тесту, попыток улучшения UVR посредством противофазы
и для того чтобы тест имел объективные результаты, нужно иметь постоянные составляющие - их всего две: - сам файл (September Source.wav) и модель Kim_Vocal_1
далее вы работаете противофазой со своими дополнениями - повторным вычитанием отрендеренных "выскочек"
Цитата:
я ещё ничего не выкладывал
это про ссылку откуда вы взяли September - там есть результаты работы просто модели, а есть с использованием противофазы
[Профиль]  [ЛС] 

98gurkao

Стаж: 15 лет 4 месяца

Сообщений: 2144

98gurkao · 01-Фев-23 03:43 (спустя 6 часов, ред. 01-Фев-23 03:43)

Лоупасс фильтр на 17 кГц в файлах UVR, синий график это инструментал UVR, белый график относится к файлу, полученному вычитанием вокала в хосте:

Рассмотрим теперь сценарий с отдельными артефактами.
В примере специально обозначил, что была взята топовая одиночная модель из текущего рейтинга, kim vocal model c соответствующими настройками, без подбора самого подходящего конкретному источнику метода — для демонстрации вычитания в DAW использование топовой модели рейтинга одиночных алгоритмов более чем наглядно (если не наглядно, см. рисунок). Однако эта модель не будет оптимальной на всей продолжительности данного источника. Например в первой строчке вокала 'do you remember', которая поётся внутри хвоста реверберации первого аккорда, эта модель оставляет след вокала. Модель со второго места рейтинга, kim vocal model с настройкой компенсацией громкости 1,035 (вместо автоматического режима первой модели) даёт намного более чистый вариант конкретно для этой фразы, при этом компенсировать её громкость при вычитании в DAW нужно на меньшее значение: на +0,29881 дБ (против +0,62817 дБ в первом случае). На этом различия двух топовых моделей не заканчиваются, их результаты отличаются АЧХ, джиттером, офсетом фазы и другими параметрами. Самое главное что они отличаются порогом выборки для разделения конкурирующих частот источника по громкости на стемы в тех участках АЧХ, где они конкурируют за одни и те же частоты.
Для представленного источника вторая модель во фразе 'do you remember' решает задачу лучше, подобный результат реализуем в хосте. Если для этого участка песни подобрать другое значение компенсации громкости изолированного вокала, то фраза вычтется практически в ноль при +0,32429 дБ. У разных моделей этот параметр разный и возникает в результате различий между алгоритмами в определении границ стемов внутри одного блока частот. В хосте всегда можно подобрать наиболее подходящий уровень громкости для любого участка композиции, поскольку алгоритм усредняет значение компенсации для всего трека в целях достижения наилучшего значения критерия SNR. Это ещё одна причина того, что при вычитании изолята вокала в хосте из оригинального трека в подавляющем большинстве случаев результат будет лучше, чем инструментал UVR той же модели с теми же настройками.
Вот полученный после дополнительной коррекции громкости начальной фразы файл, можно сравнить его с инструменталом UVR. Также в файле скорректирован уровень последней фразы, которая в инструментале UVR тоже торчала. Теперь не торчит.
files.fm/u/8hadkk9r5
[Профиль]  [ЛС] 

Rus.sak

Стаж: 16 лет 3 месяца

Сообщений: 371


Rus.sak · 01-Фев-23 16:53 (спустя 13 часов, ред. 01-Фев-23 18:43)

FotoTash писал(а):
сам файл (September Source.wav) и модель Kim_Vocal_1 далее вы работаете противофазой со своими дополнениями - повторным вычитанием отрендеренных "выскочек"
Именно это я и проделал. Так как uvr у меня без гпу, алгоритм ансамбля у меня стандартный по времени трек разделяет часа полтора (не устраивает). Ким справляется за 15 минут (один только её результат меня не устраивает) + противофаза минут 7 + заключительно vst навесы (если есть необходимость) минут 10..... 35 минут против 1:30 которые скорее всего ещё придется допиливать.
[Профиль]  [ЛС] 

98gurkao

Стаж: 15 лет 4 месяца

Сообщений: 2144

98gurkao · 01-Фев-23 17:17 (спустя 23 мин.)

Трудности перевода продолжаются…
[Профиль]  [ЛС] 

Rus.sak

Стаж: 16 лет 3 месяца

Сообщений: 371


Rus.sak · 01-Фев-23 20:07 (спустя 2 часа 50 мин., ред. 01-Фев-23 20:07)

Эксперименты продолжаются... Полученный с помощью kim vocal model вокал изолировал от наложенного на него ревера и шипящих средствами vst, далее в противофазу... без рендера "выскочек"
Догнал что именно гробит минус-это ревер на вокале который в противофазе давит живой или мастер ревер наложенный на инструменты или всю композицию в целом при сведении. Касательно шипящих в вокале - они съедают (артефачат) высокие и часть средних частот в будующем минусе.
98gurkao писал(а):
84233733Теперь не торчит. files.fm/u/8hadkk9r5
Трудоёмко, но того стоит!
[Профиль]  [ЛС] 

FotoTash

Стаж: 5 лет 3 месяца

Сообщений: 710


FotoTash · 02-Фев-23 00:13 (спустя 4 часа)

Rus.sak писал(а):
84236519Эксперименты продолжаются...
очень удачный вариант, лучший из всех представленных, включая ансамбли от Ubiquitousabug
[Профиль]  [ЛС] 

98gurkao

Стаж: 15 лет 4 месяца

Сообщений: 2144

98gurkao · 02-Фев-23 02:51 (спустя 2 часа 37 мин.)

Rus.sak
Имел в виду то, что опыт по вычитанию, для сравнения результатов именно вычитания, не требует делать новые изоляты, нужно обработать существующий изолят из теста. Другие алгоритмы будут давать разные результаты, и даже другие прогоны в одном алгоритме могут давать другой результат, соответственно для корректного сравнения именно результатов вычитания в хосте нужно пользоваться одним набором данных с известными характеристиками. Пользуясь разными данными сравнить результаты вычитания в хосте невозможно — они будут разные потому, что использовались разные данные, невозможно выявить, какие улучшения или ухудшения в звуке произошли потому, что было лучше настроено вычитание в хосте, или потому, что использовались разные источники данных.
По поводу трудоёмкости — вообще не трудоёмко. Просто подготавливаешь проект в хосте со всеми нужными дорожками и плагинами, и сохраняешь его для всех случаев работы с изолятами. Далее всё что нужно — открыть проект, закинуть в уже готовые дороги три файла, и подкручивать уровень громкости ровно на одном плагине в одной дорожке. Если есть отрывок, где нужен другой уровень громкости, делаешь временную копию трека и отстраиваешь громкость для этого участка, после этого оставляешь один трек и на нём делаешь автоматизацию громкости на нужное количество децибел. Всё.
Буквально весь мой проект, в качестве «эффектов» только регулятор громкости
Rus.sak писал(а):
Если вычесть этот результат из оригинального источника, то чистой акапеллы не будет — в ней будет звучать микс. А если внимательно послушать предоставленный результат отдельно, то вокруг двух основных транзиентов инструментала на 0,9 с звучит остаток вокала, слоги 'mem-ba' слова 'remember', согласными 'm' и 'b'попадающими в транзиенты оркестра. В слове 'september' на 4,6 с слышны слоги 'tem-ba', особенно последний. Слово 'changing' на 6,7 с целиком слышно, в слоге 'pre' из слова 'pretender' на 8,1 с звучит тон голоса, и так далее. На протяжении всего отрывка слышен почти весь вокал — то есть о какой-либо полной изоляции не может идти речи. В итоге недоизолированный вокал, украшательство реверберацией и прекрасно слышен шшшшш эмуляции ленты или ламп.
С ревербератором идея правильная, однако неверна предпосылка о том, что «ревер давит» — ревербератор вокала ничего не может давить в инструментале, ведь вокал удаляется, а не добавляется. Эта логика вполне может быть непривычной. Когда нет вокала, из микса очевидно убирается значительная часть пространства, которое этим вокальным ревербератором и создавалось звукоинженером. На инструментале регулярного микса дополнительного пространства зачастую меньше, чем в вокальной дорожке, и этот трек не исключение, однако то, как именно хвосты реверберации разделятся между стемами зависит от использованной модели UVR. Для восполнения потерянных хвостов на инструментал можно повесить хитро настроенный ревербератор. Во-первых, его громкость будет управляться амплитудой вокала по сайдчейну, но в инверсном режиме, не как компрессор, а как экспандер: когда звучит вокал, тогда добавляется амплитуда выхода ревербератора. Чтобы при этом обрабатывать ревербератором только те частоты, которые были выхвачены в вокальный трек, можно в качестве спектрального сайдчейна для конечной АЧХ ревербератора использовать soothe2, уровень обработки которого тоже будет подключен к сайдчейну из вокала. Таким образом громкость и частотная картина результата реверберации будет полностью завязана на изолированный вокал, то есть к оригинальному инструменталу будет подмешиваться минимум новых призвуков, а будут возвращаться только те, которые «потерялись» в вокале.
Результат звучит так: files.fm/u/5e2nt7anx
Если его вычесть из оригинального источника, одновременно вычитая вокал, будет прекрасно слышно, что именно добавлено. Картинкой спектральный баланс добавленного можно отобразить вот так:

Все использованные эффекты одной картинкой:
[Профиль]  [ЛС] 

Rus.sak

Стаж: 16 лет 3 месяца

Сообщений: 371


Rus.sak · 02-Фев-23 19:28 (спустя 16 часов, ред. 02-Фев-23 19:28)

98gurkao
скрытый текст
Прекрасно понимаю о чём вы и понимал это ещё до вашего комента (и с большей частью написанного вами совершенно согласен). Справедливость, чистота эксперимента, максимальная реализация знаний (ваших) и т.д... Когда просто уйма знаний и некуда их реализовать-это конкретно напрягает (понимаю)... но пусть лесом идёт это занудство, а это именно оно! Теперь мне нравятся фильмишки с кучей спецэффектов - не хочу театр ))
Цитата:
если внимательно послушать предоставленный результат отдельно, то вокруг двух основных транзиентов инструментала на 0,9 с звучит остаток вокала
да даже прислушиваться не надо, его слышно, тем более помня вокал ушами, правда его слышно во всех вариантах, только здесь возврат ревера акцентировал эти хвосты, но мне нравится, потому что я до сих пор в восторге от данной возможности uvr, и понимаю что дальше будет только лучше.
Цитата:
прекрасно слышен шшшшш эмуляции ленты или ламп
Тоже услышал ленты и лампы в результате у Ubiquitousabug, а после захотел их услышать и в своём результате, после получения похожего результата, понял что мы с Ubiquitousabug не виноваты, они (ленты и лампы) сами уже там были ))
Мне понравились все выложенные ребятами\вами результаты алгоритмов и противофазы, но надо эксперементировать дальше, а не только так и не как по другому типа
Цитата:
Имел в виду то, что опыт по вычитанию, для сравнения результатов именно вычитания, не требует делать новые изоляты, нужно обработать существующий изолят из теста
сами же написали
Цитата:
Другие алгоритмы будут давать разные результаты
а потом
Цитата:
сохраняешь его для всех случаев работы с изолятами
далее
Цитата:
делаешь временную копию трека и отстраиваешь громкость для этого участка
ну блииин... ну уже получается совсем не для всех случаев работы как не крути. Извилинами и ушками поработать придётся, а ушки при рождении не выбирают.
Для вас, для меня и ещё для кого то можно сказать как вы написали
Цитата:
"ВСЁ"
а для большинства - это тёмный лес, тем более мы в ветке uvr (нафиг знания, слух, хочу всё просто и прям ща)
Короче не хорошо-чтобы устроенный ребятами эксперимент становился по чьим то единоличным правилам, хорошо-эксперементировать на пофиг, сегодня чистый uvr, завтра противофаза с отстройкой громкости, далее с выскочками, после с ревером, потом ещё кто что-то подкинет... интересно же.
[Профиль]  [ЛС] 

kinezkinez

Стаж: 12 лет 3 месяца

Сообщений: 8


kinezkinez · 03-Фев-23 19:23 (спустя 23 часа)

98gurkao писал(а):
По поводу трудоёмкости — вообще не трудоёмко.
коллега, я знаю, вы подробно объяснили
4. Нормально изолированные файлы в ..............
пожалуйста, объясните еще раз, если можете (слова ÷ gif)
1) и подкручивать уровень громкости ровно на одном плагине в одной дорожке.
2) Если есть отрывок, где нужен другой уровень громкости, делаешь временную копию трека и отстраиваешь громкость для этого участка,
3) после этого оставляешь один трек и на нём делаешь автоматизацию громкости на нужное количество децибел.
[Профиль]  [ЛС] 

98gurkao

Стаж: 15 лет 4 месяца

Сообщений: 2144

98gurkao · 03-Фев-23 20:36 (спустя 1 час 13 мин., ред. 03-Фев-23 20:36)

Rus.sak писал(а):
84241061Тоже услышал ленты и лампы в результате у Ubiquitousabug, а после захотел их услышать и в своём результате, после получения похожего результата, понял что мы с Ubiquitousabug не виноваты, они (ленты и лампы) сами уже там были ))
Вот именно, что ленты и лампы в оригинале уже были, и их не требуется добавлять, в твоём минусе точно добавлена сатурация верха. Ubiquitousabug тут ни при чём, он использовал другую модель UVR, а речь идёт о результатах вычитания, а не различия моделей. По твоим словам ты вычитал предоставленный в архиве изолят вокала UVR модели kim_vocals, а не результат другой модели. Твой результат не вычитается в ноль: сумма оригинального трека и дорожек вокала и инструментала в противофазе должна быть практически нулевой, в моём изначальном архиве для теста это порядка -160 дБ (-130 дБ true peak). При вычитании твоего инструментала из оригинила, с одновременным вычитанием изолята вокала UVR, тоже должен быть почти ноль, а по факту звучит -35 дБ (-20 дБ true peak), это очень много. Этот звук составляет во-первых ревер, во-вторых обработка высоких частот (сатурация «лентой» или «лампой»), не имеющая никакого отношения к оригинальному треку и в-третьих, слышимые остатки вокала. Тут о чистоте изоляции минуса говорить не приходится: он не соответствует оригиналу (украшен) и содержит вокал (недоизолирован). Это факты.
Если сравнивать результаты чисто работы моделей, то пока что мало результатов.
Изолят инструментала Ensemble Mode с моделями 1_HP-UVR и 7_HP2-UVR, как и изолят одной модели 7_HP2-UVR в местах, где вырезан вокал, отчётливо звучит деградационный ступенчатый фильтр, примерно как маленький трактор тр-тр-тр-тр-тр от 1 кГц и выше до самого верха. Особенно отчётливо он слышен в паузах между аккордами, там где должен был быть вокал. В оригинале трека его нет. Микро-трактор появляется когда ступенчатая гребёнка окна FFT создаёт эффект алиазинга на переходных частотах по причине отсутствия денойза в вокальном изоляте. Настройки сглаживания артефактов это Denoise для моделей MDX_Net в интерфейсе программы, для моделей VR_architecture такой настройки нет, и без сглаживания в алгоритмах с маленьким окном и небольшой агрессивностью будет работать микро-трактор. Будет его слышно или нет, зависит в том числе от того, что за источник мы скармливаем программе. В данном примере его отчётливо слышно.
Также вследствие использования в модели 7_HP2-UVR фильтра с линейной фазой (ничем другим этого объяснить не могу) в предоставленных файлах все транзиеты ударных смазаны и вместо «цык» звучит «шик», вместо «тук» звучит «фук». Это стандартное поведение таких фильтров Поскольку в данной модели не обрезан верх, как это сделано в Kim_vocal_1, можно сделать вывод, что здесь они пытались сохранить ВЧ от обрезания путём подстройки метода фильтрования (потому и названия 1HP, 2HP и так далее), но сделать это удалось только ценой применения линейной фазы, откуда и возник preringing. Именно так он и звучит на транзиентах — шмяк и плюх. Проверяется на любом звуке, насыщенном транзиентами, включением и отключением линейной фазы на предельном HP фильтре.
Итого — Kim_Vocal_1 обрезает верх, сглаживает артефакты, не трогает транзиенты, 7_HP2-UVR верх не обрезает, не сглаживает артефакты, смягчает транзиенты.
Ubiquitousabug
А какие настройки окна и агрессивности использовались для модели 7_HP2-UVR?
[Профиль]  [ЛС] 

Ubiquitousabug

Стаж: 12 лет 3 месяца

Сообщений: 557

Ubiquitousabug · 04-Фев-23 01:11 (спустя 4 часа)

98gurkao писал(а):
84246733Ubiquitousabug
А какие настройки окна и агрессивности использовались для модели 7_HP2-UVR?
Я сейчас не дома, но есть ссылка со скриншотами, которую я недавно отсылал интересующемуся в личку. Только на скриншоте вместо обычно используемого значения агрессивности 10 указано 15, это я пару раз экспериментировал, а так обычно 10.
[Профиль]  [ЛС] 

98gurkao

Стаж: 15 лет 4 месяца

Сообщений: 2144

98gurkao · 04-Фев-23 02:43 (спустя 1 час 31 мин.)

Ubiquitousabug
Благодарю, несмотря на то, что скриншоты относятся к ансамблю, а не к модели в одиночном режиме, окно 320 и агрессивность 10 дают для 7_HP2-UVR ровно тот результат, что был опубликован, вопрос закрыт. С другими настройками окна и агрессивности результаты отличаются.
[Профиль]  [ЛС] 

Ubiquitousabug

Стаж: 12 лет 3 месяца

Сообщений: 557

Ubiquitousabug · 04-Фев-23 03:34 (спустя 50 мин., ред. 04-Фев-23 03:34)

98gurkao писал(а):
84248088скриншоты относятся к ансамблю, а не к модели в одиночном режиме
На втором скриншоте - общие для моделей VR Architecture настройки. Они действуют как в режиме "ансамбля", так и в одиночном. Первый скрин относится к Ensemble Mode с моделями 1_HP-UVR и 7_HP2-UVR.pth. А при попытках использовать большее количество моделей - сообщение об ошибке, нехватке памяти GPU.
[Профиль]  [ЛС] 

Rus.sak

Стаж: 16 лет 3 месяца

Сообщений: 371


Rus.sak · 04-Фев-23 20:26 (спустя 16 часов, ред. 04-Фев-23 20:26)

скрытый текст
98gurkao писал(а):
Вот именно, что ленты и лампы в оригинале уже были, и их не требуется добавлять, в твоём минусе точно добавлена сатурация верха.
Не помню когда мы перешли на ты и что вас так вывело из себя, чтобы начать тыкать не знакомому человеку, но да ладно...
Нет! в моём "минусе" нет добавленной сатурации верха ни лентами, ни лампами (дважды написал об этом), я считаю, что это результат изоляции мной ревера с вокала, (да) полученного моделью ким с архива, и изоляции вокала от шипящих, т.к это всё, что было сделано.
98gurkao писал(а):
Твой результат не вычитается в ноль..Этот звук составляет во-первых ревер, во-вторых обработка высоких частот (сатурация «лентой» или «лампой»), не имеющая никакого отношения к оригинальному треку и в-третьих, слышимые остатки вокала. Тут о чистоте изоляции минуса говорить не приходится: он не соответствует оригиналу (украшен) и содержит вокал (недоизолирован). Это факты.
Написал же "Эксперимент", а не титул на звание лучшей изоляции вокала... и он заключался в том, чтобы вернуть то, что было съедено в инструментале (а это в первую очередь ревер и высокие)... и вернуть можно, но пока только с вокальным хвостом и ВЧ, которых (да) в оригинале я тоже не наблюдал. Работаю пока над этим.
Если у вас есть время столько строчить, и вроде теорией блещите, возможно и на мини туторы в mp4 нашли бы время (хотябы того, что сейчас имеете), тем самым сделав доброе дело и без лишней гемагогии.
Цитата:
Твой результат не вычитается в ноль
Я уже писал как результатом рендера "выскочки" можно легко и быстро добиться вычитания в полный ноль, но в предоставленных данных FotoTash ким модель отработала не так корректно как хотелось бы и оставила хвосты в инструмментале, поэтому если выводить микс для анализа в полный ноль, вы услышите абсолютную копию полученную UVR с хвостами вокала в инструментале, поэтому мой результат вы не смогли вычесть в ноль т.к ноля там нет и в данном подопытном быть не должно... по поводу подстройки громкости, то в моём случае её необходимо проводить на "выскочке", а не на самом вокале.
https://cloud.mail.ru/public/M6yM/aaZxJKukA
По поводу получения "выскочки".
https://cloud.mail.ru/public/HG6o/aZotyGvCV
По поводу изоляции от ревера и были ли повешаны лампы или ленты. PS: De-ess - ером от шипящих не изолировал в этом результате, тупо забыл, перезаписывать видео из-за этого в лом.
Зачем изолировал от ревера? Вместе с ревером Ким съела часть инструментала (он отчётливо прослеживается в отделённом Ким вокале), который в противофазе вычитывается вместе с вокалом, а это не есть хорошо!
Забыл уточнить, что и этот вариант (материал тот же) так же нуждается в понижении громкости "выскочки" примерно на 7dB/
https://cloud.mail.ru/public/uLEe/pJVwf73YX
По поводу модели 1_HP+7_HP2, которые нашёл Ubiquitousabug, действительно дают лучший результат. И да, здесь с помощью "выскочки" (она же Kaka) при вычитании мы получаем полный ноль в изоляте и отличный результат без необходимости подстройки громкости. После можно уже кидать гибкие украшательства)))
https://cloud.mail.ru/public/DL8z/5mfZDzA6f
И ещё раз, вот вам вычет в ноль с выскочкой и без неё!
https://cloud.mail.ru/public/tuPU/a6rbbWnwM
[Профиль]  [ЛС] 

Ubiquitousabug

Стаж: 12 лет 3 месяца

Сообщений: 557

Ubiquitousabug · 05-Фев-23 17:48 (спустя 21 час)

Rus.sak
А что такое в данном контексте "выскочка"? До сих пор не понял, поэтому решил поинтересоваться.
[Профиль]  [ЛС] 

Rus.sak

Стаж: 16 лет 3 месяца

Сообщений: 371


Rus.sak · 05-Фев-23 18:48 (спустя 59 мин., ред. 05-Фев-23 18:49)

Ubiquitousabug писал(а):
84256011Rus.sak
А что такое в данном контексте "выскочка"? До сих пор не понял, поэтому решил поинтересоваться.
))) остатки того, что полностью не вычитается противофазой вокала и инструментала из плюса (где по факту должен получиться "0" по dB)... извеняюсь, пришлось и дальше употреблять этот жаргон, чтобы продолжить то, что писал ранее.
[Профиль]  [ЛС] 

Ubiquitousabug

Стаж: 12 лет 3 месяца

Сообщений: 557

Ubiquitousabug · 05-Фев-23 18:51 (спустя 3 мин., ред. 05-Фев-23 18:51)

Rus.sak писал(а):
84256264остатки того, что полностью не вычитается противофазой вокала и инструментала из плюса...
Спасибо, теперь понял. Надо будет самому попробовать заняться этим вычитанием, когда будет свободное время.
[Профиль]  [ЛС] 

Rus.sak

Стаж: 16 лет 3 месяца

Сообщений: 371


Rus.sak · 05-Фев-23 22:55 (спустя 4 часа, ред. 05-Фев-23 22:55)

Ubiquitousabug писал(а):
84256277Надо будет самому попробовать заняться этим вычитанием, когда будет свободное время.
Конечно. Тем более пока нет народного Demixer-а, этим способом можно отделять не только сольный, но и бэк вокал, правда для дальнейшего вычитания противофазой плюс придётся пропустить через uvr дважды, 1-это модель караоке, 2-это модель (например) HP, далее инструментал полученный караоке, в котором оставлен бэк вычитаем инструменталом полученным НР, в котором бэк отсутствует.... Получаем А бэк Б сидели на трубе, А упала, Б пропала... Бэк остался.
[Профиль]  [ЛС] 

xcrazymx

Стаж: 16 лет 11 месяцев

Сообщений: 8

xcrazymx · 06-Фев-23 20:31 (спустя 21 час)

sephirotto писал(а):
84060589ANtoNNN1
А потом нейросети проанализируют миллионы треков, научатся писать музыку, как уже научились писать картины, и музыканты взвоют и будут протестовать против ИИ, как уже протестуют художники)
Доброго дня нет новостей по разработке где там ударочка будет еще отлепляться на кик снейр итд? Всего наилучшего! Спасибо за годный продукт! НУ и вопрос для митала что порекомендуете Demusc | v4 htdemucs_6s ?
[Профиль]  [ЛС] 

98gurkao

Стаж: 15 лет 4 месяца

Сообщений: 2144

98gurkao · 07-Фев-23 11:58 (спустя 15 часов, ред. 07-Фев-23 11:58)

Ubiquitousabug писал(а):
84248168при попытках использовать большее количество моделей - сообщение об ошибке, нехватке памяти GPU
Если сообщение об ошибке содержит примерно такое описание:
Цитата:
OutOfMemoryError: "CUDA out of memory. Tried to allocate A (GPU 0; B total capacity; C already allocated; 0 bytes free; D reserved in total by PyTorch)
И при этом B>A и D>C, то проблему в широком диапазоне этих чисел решает пара строчек кода, но для этого нужно воспользоваться не скомпилированной версией .exe, а предкомпилированным оригинальным кодом на python. Потребуется скачать и установить Python и пару библиотек для поддержки, но всё это делается достаточно быстро. У меня эта схема позволила запустить почти все модели на любых настройках, а без такой редакции примерно треть моделей отказывалась запускаться в ряде случаев по причине святого грааля всея ИИ CudaOutOfMemoryError. Проверено, работает. Потребуется короткий тестовый wav файл 3-4 секунды длительности, с вокалом.
Установка всего необходимого
1. Скачиваем Python 3.9.13 (новее лучше не качать, поскольку ряд библиотек могут быть не вполне развёрнуты под более продвинутое окружение).
2. Просто запускается установочный файл, но важно — отметить внизу галочку Add Python to Environment Variables / Add to PATH. Принципиальное руководство по инсталляции.
3. Идём на гитхаб UVR, где будет раздел Manual Installation, нажать по нему, откроется алгоритм установки (в т.ч. питона), скачиваем репозиторий UVR по первой ссылке.
4. Распаковываем архив в любое удобное место, но убеждаемся, что к папке есть доступ и файлы в ней не отмечены как «только для чтения», то есть лучше не в системные директории. Получится некая папка ultimatevocalremovergui-master с файлами внутри. Убеждаемся, что в папке есть файл requirements.txt
5. Открываем папку, и в проводнике в адресной строке набираем вместо её адреса cmd — откроется командная строка. В ней набираем:
Код:
py -m pip install -r requirements.txt
6. Если питон был установлен правильно и при установке прописан PATH, то команда py сработает без проблем, если PATH не прописан, то нужно найти адрес, куда установлен питон, и вписать этот адрес, включая имя исполняемого файла целиком вместо py, то есть команда будет примерно такая:
Код:
C:\что-то там\где-то\Python39\python.exe -m pip install -r requirements.txt
7. Должна запустится установка необходимых модулей UVR. Она занимает пару минут. После установки проверяем, что программа запускается, для этого в командной строке пишем:
Код:
py uvr.py
8. Интерфейс должен запуститься, однако в нём не будет моделей (их нужно скачать, либо скопировать в директорию папку с уже скачанными) и будет отсутствовать опция расчётов на GPU. Чтобы её включить, нужно скачать Pytorch, торч — фреймворк для работы с видеокартой, он весит около 2 Гб:
Код:
py -m pip install --upgrade torch --extra-index-url https://download.pytorch.org/whl/cu117
9. Также в папку нужно бросить файл FFmpeg.exe из этого билда, или скопировать его из папки основной программы; а заодно оттуда можно скопировать файлы rubberband.exe и sndfile.dll, или же скачать их отсюда.
10. После того, как эти файлы добавлены, установлен Pytorch и скачана хотя бы одна модель, можно протестировать работу программы на обычных настройках, убедиться, что программа не отдаёт ошибки. Если файл просчитывается и всё ок, переходим к тонким настройкам.
Тонкие настройки заключаются в том, что описано в руководстве торча в разделе менджмент памяти.
Суть проста. Менеджер видеопамяти PYTORCH_CUDA_ALLOC_CONF управляется из торча четырьмя параметрами.
max_split_size_mb — размер блока видеопамяти, свыше которого блоки не будут разделяться на более мелкие части, это основная настройка.
roundup_power2_divisions — округление общей запрошенной видеопамяти до размера, кратного степени двойки, что в некоторых случаях повышает эффективность её расхода.
roundup_bypass_threshold_mb — порог по размеру для такого округления, если запрошенная видеопамять больше чем заданное число, то этот размер далее не округляется, также служит эффективности распределения памяти.
garbage_collection_threshold — порог срабатывания сборщика мусора, оставшегося в видеопамяти от вычислений.
В целом, для карт с небольшим количеством VRAM основной и даже единственной настройкой служит max_split_size_mb, которая служит для контроля фрагментации видеопамяти при её загрузке, но мы добавим все четыре, чтобы можно было экспериментировать. Для этого в блокноте или другом текстовом редакторе типа Notepad++ или SublimeText и тому подобных открываем файл uvr.py.
В начале этого файла идёт блок импорта конфигурации # GUI modules, убеждаемся, что в нём есть строчка import os. Если её вдруг нет, просто добавляем под блоком импорта эту строчку, или прямо в середину блока или его начало. После этого прокручиваем в конец блока импорта (где идут команды import или from) и нажав пару раз перенос строки добавляем код:
Код:
#os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "roundup_bypass_threshold_mb:512"
#os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "roundup_power2_divisions:8"
#os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "garbage_collection_threshold:0.1"
#os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "max_split_size_mb:1024"
Убирая решётку # перед строкой, мы делаем её активной, если вернуть решётку, тогда строка закоменчена и исполняться не будет. Оставим пока все четыре строки закоменчеными, сохраним файл и проверим, что всё по прежнему запускается и добавленные изменения не повлекли ошибку запуска. Если всё нормально, раскоменчиваем последнюю строку с командой max_split_size_mb и начинаем тестировать параметр. В качестве размера можно вписать любое число больше 20.
Общая магия состоит в том, что отчёт об ошибке, возникающий вследствие выбора модели, которая заведомо изначально не запускается с определёнными настройками, например 7_HP2-UVR с окном 1024 и агрессивностью 10, является подсказкой для направления поиска правильного параметра:
Цитата:
OutOfMemoryError: "CUDA out of memory. Tried to allocate A (GPU 0; B total capacity; C already allocated; 0 bytes free; D reserved in total by PyTorch)
Во-первых смотрим, что размер запрошенной памяти A не превышает размер всей существующей B. Если превышает, то распределять бесполезно. Затем выключаем всех потребителей GPU — браузер, проигрыватель, выгружаем программы из диспетчера задач и тд. Вписываем в параметр некое число, например 512, сохраняем файл, и вновь запускаем в командной строке программу:
Код:
py uvr.py
Когда возникла вторая ошибка, смотрим, как изменились значения распределения памяти. Если произошло хотя бы одно из трёх: уменьшился размер запрашиваемой памяти A, увеличилось количество свободной памяти или уменьшилась разница между резервной и распределённой D–C — то мы на верном пути. Основная суть — как только резервная память станет меньше, чем распределённая, модель заработает, как только размер запрашиваемой станет меньше свободной, модель заработает. Записываем куда-то полученные из ошибки значения для контроля, и пробуем новый размер. Общий принцип в том, что мы проверяем показатели при минимальном размере 21 Мб, затем проверяем показатели при максимальном, например 2048 Мб, а затем делим примерно пополам, и смотрим, в какую сторону от середины настройки больше отвечают трём требованиям. Оставшееся расстояние вновь делим пополам, и снова оцениваем, в какую сторону нужно двигаться. В итоге для карт с небольшим количеством VRAM можно существенно улучшить показать выработки моделей, поскольку данный параметр PYTORCH_CUDA_ALLOC_CONF чрезвычайно влиятелен вследствие фактического разнообразия чипов, их производителей, конкретных схем устройства и обращения к памяти.
Обратной стороной этого параметра является его влияние на эффективность утилизации GPU, поэтому его почти никогда не оставляют для пользовательской настройки в компилированных приложениях, ибо подразумевается, что программа должна исполняться с достаточной эффективностью на мощных машинах, и хоть как-то запускаться на слабых, поэтому настройки какие-то средние. А для обхода CudaOutOfMemoryError требуется как раз пограничная настройка параметра, которая для разных устройств (и разных моделей) очень сильно отличается. Например у меня в одной модели хорошо работает размер 166 Мб, а в другой 512.
Бонусом идёт то, что файл uvr.py можно продублировать с разными именами типа uvr166.py и uvr512.py — и настроив каждую копию под конкретный размер и модель, тем самым иметь глобальный параметр конфигурации распределения видеопамяти на уровне исполняемого файла, то есть просто запускать нужный файл под нужную модель или ансамбль и не париться.
[Профиль]  [ЛС] 

Ubiquitousabug

Стаж: 12 лет 3 месяца

Сообщений: 557

Ubiquitousabug · 07-Фев-23 12:31 (спустя 33 мин.)

98gurkao
Это не для моих мозгов Не шарю я в этом.
[Профиль]  [ЛС] 

98gurkao

Стаж: 15 лет 4 месяца

Сообщений: 2144

98gurkao · 07-Фев-23 13:18 (спустя 46 мин.)

Ubiquitousabug
Там всё не так страшно, как я описал ))
Результаты настройки программы под конкретную видеокарту исключительно позитивные. Метод во многих случаях позволяет решить ошибку недостатка памяти любого GPU при использовании некоторых моделей и ансамблей, поскольку нехватка памяти часто возникает не столько по причине физического ограничения видеокарты, сколько потому, что приложение использует дефолтную конфигурацию pytorch, для работы на большинстве существующих конфигурациях CUDA, и отсутствием настроек pytorch под конкретную систему игнорирует её непосредственные характеристики.
[Профиль]  [ЛС] 

аксаков

Стаж: 16 лет 1 месяц

Сообщений: 110


аксаков · 10-Фев-23 01:47 (спустя 2 дня 12 часов)

Всем привет, а если такая программа, или в этой программе, можно ли сделать такое, удалить основной вокал, и оставить только бэк вокал?, а потом соединить бэки с минусом? в интернете кто то говорил, что такое можно делать))) Заранее спасибо, за ответ, очень срочно нужно вытащить только бэки с песни, и подмешать их к минусу)))
[Профиль]  [ЛС] 

98gurkao

Стаж: 15 лет 4 месяца

Сообщений: 2144

98gurkao · 10-Фев-23 16:09 (спустя 14 часов, ред. 10-Фев-23 16:09)

аксаков
Разделить основной вокал от бэков возможно. Результат будет зависеть от характеристик сведения источника, из которого нужно вытянуть вокал.
В сети полно платных приложений и ресурсов, которые обещают это сделать. Например — AudioSourceRE DeMIX Pro или moises.ai и другие, тысячи их. На выходе там почти всегда мыло потешного качества, но рекламных слоганов выше крыши. Имеет смысл послушать их промо материалы, и если такого результата достаточно, то можно даже не начинать заморачиваться и просто просеять один трек через платный сервис. Тем более если срочно и горит.
Для более качественного результата потребуется немного поработать в хосте с изолятом вокала, полученным в UVR. Результат в любом случае будет зависеть от того, как был сведён источник, но в целом он будет лучше, чем мыло из большинства платных балалаек. На это уйдёт от пятнадцати минут до пары-тройки часов, в зависимости от навыков и характеристик источника.
[Профиль]  [ЛС] 

svalex1

Стаж: 10 лет 11 месяцев

Сообщений: 45


svalex1 · 10-Фев-23 18:10 (спустя 2 часа 1 мин.)

Цитата:
Например — AudioSourceRE DeMIX Pro или moises.ai и другие, тысячи их. На выходе там почти всегда мыло потешного качества, но рекламных слоганов выше крыши.
Осталось за малым: найти способ как оплатить этот платный сервис. )))
И даже если вы умудритесь оплатить услугу, не факт что она будет исполнена, скорей всего не будет исполнена, так как они жестко отслеживают откуда идёт запрос и всякие ВПН-ы не помогают. Так что все эти платные сервисы - деньги на ветер, пока. ))
Во всяком случае для жителей РБ и РФ именно так. )
У меня была годовая подписка на DemixPro, её обрубили после 9 месяцев, а деньги за оставшиеся 3 месяца так и не вернули.
[Профиль]  [ЛС] 

98gurkao

Стаж: 15 лет 4 месяца

Сообщений: 2144

98gurkao · 10-Фев-23 18:46 (спустя 36 мин.)

svalex1
Мне услуги этих комиков оплачивать не требуется, поскольку для разделения вокала и бэков я с изолятами UVR в хосте получу результаты лучше. Но если кому-то нужно провести оплату за то, что потешные клоуны попытались жидко прикрыть, то существует достаточно способов это сделать, ВПНы и отслеживаение их запросов не имеют ровным счётом никакого значения. Кроме того, можно найти и бесплатные аналоги, этих квази-рабочих сервисов как грязи и все они, судя по их промо-материалам и демонстрациям в сети, предоставляют одинаково не настраиваемый мыльный результат ни о чём.
[Профиль]  [ЛС] 

svalex1

Стаж: 10 лет 11 месяцев

Сообщений: 45


svalex1 · 10-Фев-23 22:48 (спустя 4 часа)

98gurkao
Вопрос не в том какое качество получаешь на выходе, а в том что воспользоваться сервисом невозможно.
Ну а бесплатные, типа аналоги, повторюсь, просто УГ, по сравнению, с тем же Демиксом. Только Демикс сейчас недоступен, а бесплатное УГ пожалуйста - вот и приходится кормиться этим непотребством. Как говориться, за не имением горничной, имеют кухарку. )
Клоуны не клоуны, вот по барабану, кто они, если дают отличный результат.
[Профиль]  [ЛС] 

98gurkao

Стаж: 15 лет 4 месяца

Сообщений: 2144

98gurkao · 11-Фев-23 00:09 (спустя 1 час 21 мин., ред. 11-Фев-23 00:09)

svalex1
Речь у меня идёт именно о качестве. Это уже ты мне пишешь про оплату ресурса, который мне не требуется, я и отвечаю — он мне не требуется. Не требуется потому, что сколько бы не было показано результатов изоляции основного вокала и бэков в Демиксе — все полнейшее УГ и лапоть в унитазе. Если есть ссылка чтобы послушать нормальный результат вокал+бэки — буду рад послушать и изменить своё мнение на противоположное, возможно рекламщики попались криворукие. Сравнивая его результаты и результаты разделения бэка и вокала в хосте из изолятов UVR, сравнение просто не получается — у Демикса я не нашёл не то что отличного, ни одного приличного примера не попалось.
А если бы эти платные балалайки были действительно нужны и так сильно отличались от своих бесплатных аналогов, то я уже написал — «невозможность оплаты» элементарно преодолевается на раз-два. Так что мораль: вся эта накрутка «недоступности священного грааля» и «как же теперь жить» просто не работает.
Буду горячо ждать результатов работы платных программ, которых абсолютно невозможно добиться в UVR.
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error