Стартап Voicemod занимается разработкой умных инструментов для изменения человеческого голоса в режиме реального времени, создания аудиоэффектов для игр и генерирования песен. На днях компания объявила о привлечении $14,5 млн в ходе дополнительного раунда финансирования. Полученные средства будут направлены на расширение функций инструментов стартапа.
Voicemod был основан в 2014 году. Изначально компания занималась только аудиоэффектами, создавая различные звуки для игр с помощью цифровой обработки сигналов (DSP) — например, смайлики со звуковыми эффектами для игровых чатов.
Стартап до сих пор продолжает работать в геймерской сфере, но в последнее время он расширил свою деятельность, начав заниматься разработками в области модификации и синтеза человеческого голоса с помощью искусственного интеллекта. По словам представителей команды Voicemod, это приведет к совершенно новым возможностям использования инструментов компании, а также поможет значительно увеличить его аудиторию.
На данный момент стартап разрабатывает инструмент, который позволяет людям изменять свои голоса в режиме реального времени — примерно так же, как можно изменить свою внешность в видео с помощью наложения фильтров.
В прошлом году Voicemod приобрел сторонний стартап по разработке аудиоэффектов Voctro Labs для использования его технологий на объединённой платформе с инструментами по модификации голосов. Благодаря слиянию, в декабре 2022 года компания запустила новую функцию преобразования текста в песню, которая позволяет пользователям превращать свои стихи в вокальные композиции с помощью синтезированного поющего голоса. По словам разработчиков, на подходе запуск еще одной опции — возможности изменения голоса в песне, которую пользователь поёт сам в режиме реального времени.
Помимо предоставления инструментов для редактирования аудио непосредственно создателям контента, компания предлагает свои технологии в виде SDK и API для интеграции третьими сторонами в их продукты, от игр и приложений до аппаратного обеспечения.
По словам генерального директора Voicemod Джейми Боша, стартап позиционирует себя как разработчик инструментов для создателей различного вида развлекательного аудиоконтента, служа своего рода «звуковым гримом», который нужно «наносить по мере необходимости» — например, чтобы записать песню в определённом стиле или озвучить персонажа в игре. По его мнению, продукты компании имеют потенциал, чтобы стать профессиональным инструментом для людей, которые хотят создавать музыку, фильмы или игры.
Для защиты от использования своих технологий в злоумышленных целях стартап работает над алгоритмом нанесения водяных знаков на аудио — его запуск планируется в ближайшие месяцы. Это даст сторонним слушателям возможность распознавать сгенерированные искусственным интеллектом голоса и станет очень важным инструментом для противодействия всем возможным противозаконным и негативным способам применения инструментов изменения голоса, включая мошенничество, шантаж, пранки и т.д.
На данный момент инструменты стартапа доступны только на ПК. В следующем месяце компания планирует выпустить набор своих продуктов для macOS, а в долгосрочной перспективе собирается создать кроссплатформенный инструмент, которым можно будет пользоваться и на различных смартфонах.