Стартап Murf занимается разработкой инструмента для синтеза человеческой речи, и уже успел собрать библиотеку из более чем 120 сгенерированных искусственным интеллектом голосов на 20 языках (в том числе на русском), которые невозможно отличить от реальной человеческой речи. На днях компания объявила о привлечении 10 миллионов долларов в ходе раунда финансирования серии А. Возглавила раунд инвестиционная компания Matrix Partners, также в нем приняли участие несколько бизнес-ангелов.
Стартап был основан в штате Юта в октябре 2020 года выпускниками технологического института Снехой Роем, Анкуром Эдки и Дивьяншу Пандей. Технология стартапа используется для озвучки фильмов, сериалов, аудиокниг, YouTube-роликов, видеорекламы и других видов контента. По словам разработчиков, за два года на студии Murf было синтезировано более миллиона аудиозаписей в различных стилях и тонах.
Генеральный директор Murf Анкур Эдки рассказал порталу TechCrunch, что запрос на технологии синтеза речи стал особенно актуальным в пандемию, поскольку в этот период компании стали создавать больше аудио- и видео-контента, чтобы оставаться на связи со своей аудиторией. Обычно создатели контента и маркетинговые команды записывают закадровую озвучку самостоятельно или передают этот процесс на аутсорсинг, что отнимает время и требует денежных затрат. SaaS-платформа Murf, по словам Эдки, дает пользователям возможность создавать реалистичную озвучку без необходимости покупать записывающее оборудование или нанимать актера озвучивания.
Для того, чтобы озвучить текст, пользователь должен загрузить его на платформу, а затем выбрать голос из обширной библиотеки. Озвучку можно отредактировать в виртуальной студии Murf — этот процесс напоминает работу над редактированием текста. Чтобы озвучка звучала максимально реалистично и по-живому эмоционально, платформа предлагает такие функции, как выделение голосом определенных слов или фраз, регулировку высоты звука для каждого слова, расстановку пауз разной длительности и управление скоростью произношения. Также можно выбрать акцент — например, для английского языка есть варианты британского, австралийского и афроамериканского акцентов. Кроме того, в аудиодорожку с озвучкой можно добавлять фоновую музыку или звуковые эффекты.
По словам разработчиков, платформа уже собрала обширную клиентскую базу — от индивидуальных создателей контента до малых и средних предприятий в таких секторах, как образование, здравоохранение, СМИ и индустрия развлечений.
Murf предлагает свои услуги по подписке. Есть бесплатный вариант с ограниченным набором функций, по которому можно синтезировать аудио длительностью не более 10 минут. Также есть варианты для любительского, профессионального и корпоративного использования.
Полученное новое финансирование стартап планирует вложить в дальнейшее развитие своей технологии — в частности, расширить спектр языков и акцентов, на которых можно озвучить текст.