Компания ElevenLabs, известная своими разработками в области голосового ИИ, представила новую версию модели для генерации музыки — Music v2. Её главная особенность — способность переключать музыкальные жанры прямо в середине трека, не теряя цельности звучания. По словам разработчиков, модель одинаково уверенно справляется и со сложным вокалом, и с композиционной структурой произведения. Релиз состоялся 27 мая 2026 года, спустя почти 10 месяцев после выхода первой версии музыкальной модели.

ElevenLabs Music v2Источник изображения - ElevenLabs

Что умеет Music v2

Главный посыл разработчиков — устойчивость модели там, где обычные генераторы музыки начинают «рассыпаться». Генеративное аудио чаще всего ломается именно на сложных запросах, поэтому связность в длинных и насыщенных композициях — ключевое, на что стоит обратить внимание. ElevenLabs отмечает, что модель может:

  • переходить от оперы к хэви-металу и обратно в пределах одной песни, сохраняя цельность;
  • воспроизводить быстрый рэп и плотную ритмическую подачу текста без потери связности;
  • встраивать прямо в трек немузыкальные звуковые эффекты;
  • стабильно работать с разными языками — поддерживаются английский, испанский, французский, немецкий, японский и многие другие.

Сборка трека по разделам и точечное редактирование

В отличие от ранних ИИ-инструментов, которые выдавали короткие фрагменты без возможности правки, Music v2 даёт контроль над каждой частью композиции. Вместо генерации коротких отрывков музыканты теперь могут строить песню по секциям — вступление, куплет, припев — и затем «сшивать» их в единое целое.

Отдельно стоит выделить локальное перерисовывание (inpainting): артист может выделить конкретный фрагмент песни и заново сгенерировать его по текстовой подсказке, не затрагивая остальные части трека. Для контент-команд это означает быстрые итерации и заметно меньше ручной доработки. На вход модель принимает как описание песни обычными словами, так и загруженный аудиореференс.

Три платформы и снижение цен

Music v2 лежит в основе сразу трёх продуктов ElevenLabs, каждый из которых рассчитан на свою аудиторию:

  • ElevenMusic — приложение для музыкантов и авторов, запущенное как потребительский продукт в апреле; здесь можно начать с текста, настроения или референс-трека и довести идею до полноценной композиции;
  • ElevenAPI — программный доступ к модели для разработчиков (генерация, inpainting и подбор по референсу); поддержка Music v2 здесь ожидается в ближайшее время;
  • ElevenCreative — лицензированная музыка «в масштабе» для маркетинговых и брендовых команд.

Вместе с релизом компания снизила цены на генерацию музыки в обеих версиях модели — до 50% для ElevenAPI и до 40% для самостоятельных тарифов ElevenCreative. По данным компании, её годовая регулярная выручка (ARR) достигла $500 млн в апреле 2026 года; музыка пока занимает в ней небольшую долю, но ElevenMusic — это прямой выпад в сторону пользовательской базы Suno.

Условия использования различаются по тарифам: на самостоятельных планах разрешено онлайн- и офлайн-применение в коммерческих целях, за исключением кино, ТВ и студийных игр, тогда как корпоративные планы снимают эти ограничения.

Гонка ИИ-генераторов музыки

В последние месяцы ИИ-лаборатории активно соревнуются в выпуске моделей, способных создавать музыку профессионального уровня. Новые решения для генерации более длинных и сложных треков представили также Google, Stability AI и Suno. На конференции для разработчиков Google I/O компания Google добавила в свой инструмент Flow Music возможность легко создавать каверы, редактировать песни по секциям и генерировать музыкальные видео.

Практически одновременно с Music v2 свою модель обновила и Stability AI, выпустив Stable Audio 3.0 — семейство из нескольких моделей с открытыми весами для части вариантов и поддержкой более длинных композиций. Конкуренция в категории заметно усиливается.

Лицензии и вопрос авторских прав

ElevenLabs особо подчёркивает, что новая модель построена на лицензированных данных и «очищена» для коммерческого использования, поэтому созданные треки можно свободно применять. Фраза «обучена на лицензированных данных» в нынешних условиях стала едва ли не самой важной в любом анонсе ИИ-музыки.

Причина — затяжные судебные разбирательства по авторским правам. Другие музыкальные ИИ-стартапы, такие как Suno и Udio, столкнулись с исками со стороны звукозаписывающих компаний, инициированными ещё в 2024 году. Более того, по последним данным, Universal Music Group и Sony стремятся добавить к делу против Suno свыше 61 тысячи записей после того, как в ходе разбирательства всплыли свидетельства обучения на миллионах защищённых треков. На этом фоне заключение прямых контрактов с лейблами и опора на лицензированные данные становятся для ElevenLabs ключевым конкурентным преимуществом.