Stability AI выпустила аудиогенератор для создания полноценных песен

Компания Stability AI объявила о выпуске нового семейства аудиогенераторов Stability Audio 3.0. Инструмент умеет генерировать треки, качество звучания которых достигает профессионального уровня, а длительность превышает шесть минут, что в два раза дольше, чем могла создавать предыдущая версия, Stability Audio 2.0.

  • В семейство вошли 4 модели разных габаритов: большая с 2,7 млрд параметров, средняя с 1,4 млрд параметров и две мини-версии с 459 млн параметров каждая.
  • Два компактных варианта подходят для развертывания на девайсах малой мощности и могут генерировать только до двух минут аудио. Средняя и большая модели создают полноценные треки длительностью до 6 минут 20 секунд, соблюдая правила построения музыкального произведения и придерживаясь выбранной тональности на протяжении всей записи. 
  • Полученные треки можно редактировать: например, попросить модель подкорректировать или полностью переписать часть песни, поменять жанр или стиль композиции, а также дописать продолжение к уже существующий мелодии (в рамках указанных выше временных ограничений).
  • Среднеразмерная и обе маленькие модели относятся к разряду моделей с открытыми весами и открыты для публичного использования и преобразования. Полноразмерная модель доступна только через API и платные сервисы.
  • В 2024 году компания уже выпускала музыкальный генератор Stable Audio Open – тогда модель могла генерировать мелодии длительностью всего до 47 секунд.
  • Компания заявила, что сейчас в разработке находится ещё один ИИ-инструмент для профессиональных музыкантов, но подробности о его функционале пока не раскрываются. Известно, что в прошлом году компания заключила сотрудничество с музыкальными лейблами Warner Music и Universal Music с целью использования лицензионной музыки для обучения аудиогенераторов.

Источник: TechCrunch