ТОП-5 нейросетей изменяющих голос в песне

Современные неройсети могут не только создавать контент. Теперь они умеют имитировать голоса людей. Благодаря этому, в интернете появился новый тренд: AI-каверы. В них нейросеть исполняет известные песни голосами других артистов. Уже сейчас на YouTube есть более сотни таких треков. Некоторые из них весёлые, другие необычные, а какие-то звучат даже лучше оригиналов. В этой статье расскажем, как работает нейросеть, изменяющая голос в песне, на что она способна, а также рассмотрим самые лучшие сервисы по генерации голоса.

Elevenlabs онлайн нейросеть изменяющая голос в песне

Начнём нашу подборку нейросетей с простого сервиса Elevenlabs, доступного по ссылке https://elevenlabs.io/. Он не умеет петь и заменять голоса в треках, зато отлично справляется с озвучкой любого текста. Это может понадобиться вам для создания видео, презентаций, рекламы и прочего контента с записанным голосом. Теперь больше не нужно нанимать профессионального диктора и платить ему за озвучка готового текста. С этой задачей отлично справляется нейросеть.

Синтезатор речи Elevenlabs
Синтезатор речи Elevenlabs

В отличие от многих других нейронных сетей, генерирующих голос, Elevenlabs делает это правдоподобно. Голосовое сообщение, которое вы получите на выходе, не будет отличаться от записанного человеком. Elevenlabs даёт действительно высокое качество записи и правдоподобное звучание. Кроме того, на выбор доступно несколько десятков голосовых моделей, отличающихся по тембру, настроению и эмоциональному окрасу. Поэтому с Elevenlabs вы получите именно тот голос, который вам нужен.

Выбор голосовой модели в Elevenlabs
Выбор голосовой модели в Elevenlabs

Texttospeech с русской озвучкой

Недостаток прошлого сервиса в том, что он работает только с английским текстом. Если вам нужна русская озвучка, используйте нейронную сеть Texttospeech на сайте https://texttospeech.ru/. Уже сейчас отечественный аналог работает корректно, озвучивая фразы не отличимым от реального голоса. На выбор доступно 20 бесплатный вариантов озвучки и ещё несколько дополнительных голосов при покупке подписки.

Синтезатор речи Texttospeech
Синтезатор речи Texttospeech

ZVUKOGRAM ещё один синтезатор голоса

ZVUKOGRAM имеет несколько интересных функций. Например, вы можете настроить сервис так, чтобы в итоге из вашего текста получился полноценный диалог. То есть, разные фразы будут озвучены разными голосами, а вам не придётся ничего монтировать. Можно настроить эмоциональный окрас речи диктора, а также скорость произношения. Ещё одна интересная функция – установка ударений при помощи знака «+». Это позволяет добиваться от нейросети расстановки правильных акцентов.

Синтезатор речи ZVUKOGRAM
Синтезатор речи ZVUKOGRAM

SO-VITS-SVC – это уже более комплексная нейронная сеть, позволяющая изменять голос в песне на другой

SO-VITS-SVC – это одна из популярных нейросетей, при помощи которых сейчас делают AI-каверы. Для начала вам понадобится скачать саму программу по ссылке: https://github.com/voicepaw/so-vits-svc-fork. Прокрутите страницу вниз до раздела «Installation» и нажмите на кнопку «.bat download». После этого запустите скачанный файл.

Сайт, с которого можно скачать нейронную сеть SO-VITS-SVC
Сайт, с которого можно скачать нейронную сеть SO-VITS-SVC

Теперь вам понадобится установить ещё одну нейросеть, доступную по ссылке https://github.com/Anjok07/ultimatevocalremovergui. Она нужна, чтобы удалять вокальную партию из песни, в которой нужно преобразовать голос. Спуститесь вниз до раздела «Installation» и выберите пункт «Main Download Link». После этого установите на компьютер скачанный файл.

Загрузка программы для разделения вокала и инструментала
Загрузка программы для разделения вокала и инструментала

После этого запустите UVR и перейдите в раздел с настройками. Там выберите «Download Center» и скачайте модель «Kim Vocal». Когда она будет скачана переходите в главное меню и загружайте песню, которую хотите обработать. Запускайте программу и ждите, пока она закончит удаление вокала.

Меню загрузки новых голосовых моделей
Меню загрузки новых голосовых моделей

Теперь перейдите в папку с SO-VITS-SVC, откройте папку «Scripts» и пролистайте её вниз, пока не найдёте «svcg-gui.exe». Запустите его.

Файл для запуска нейронной сети
Файл для запуска нейронной сети

Перед переходом к дальнейшему этапу вам понадобится скачать голосовую модель исполнителя, при помощи которой будет генерироваться голос. Люди сами создают их, тренируя нейронные сети на десятках песен артистов. Большое количество готовых моделей доступно в интернете бесплатно. Например, по этой ссылке вы можете скачать архив с моделью Morgenstern:

Также читайте: Как видит меня нейросеть онлайн по фото бесплатно.

В открывшемся окне программы установите настройки, как на скриншоте ниже. Вы можете сами экспериментировать с ними для достижения наилучшего результата.

Обязательны к заполнению следующие пункты:

  1. Modelpatch: прикрепите скачанную голосовую модель нужного исполнителя;
  2. Configpatch: прикрепите второй файл из папки с голосовой моделью;
  3. File: выберите акапелла-версию песни, которую вы создали в другой программе;
  4. Pitch: рекомендуется устанавливать на 0, чтобы избежать искажения звука и потери качества.
Настройки генерации в SO-VITS-SVC
Настройки генерации в SO-VITS-SVC

После установки настроек нажмите на «Infer» и дождитесь окончания генерации голоса. Когда она закончится, в папке с нейросетью появится готовый файл формата .wav. Далее вам понадобится открыть программу для написания музыки, например, FL Studio. В неё загрузите две составляющие песни: голос и минус, совместите их и сохраните проект. В итоге вы получите трек, спетый голосом другого исполнителя.

Смотрите видео с подборкой других нейросетей, умеющих петь:

Владислав Игнатенко

IT-инженер, а также автор. Выпускник СПБГУ с отличием. В прошлом сисадмин и тестировщик. Сейчас ловлю тренды в технологиях.

Добавить комментарий