Синтез человеческой речи стал очень востребованной услугой в свете развития современных технологий. Синтезированная речь нужна для работы голосовых помощников, навигаторов, умных устройств и прочих сервисов и девайсов. Такой запрос приводит к росту стартапов, занимающихся преобразованием текста в человеческую речь.
Одной из таких компаний является LOVO. Это стартап, учрежденный на базе Калифорнийского университета в Беркли, занимающийся разработкой инструментов для преобразования и синтеза речи на основе технологии искусственного интеллекта. В конце августа компания заявила о завершении раунда финансирования серии A, в ходе которого было привлечено 4,5 миллиона долларов. Возглавили раунд южнокорейская звукозаписывающая компания Kakao Entertainment и ИТ-компания LG CNS; также к финансированию присоединились несколько частных инвесторов.
Стартап LOVO был основан в ноябре 2019 года Чарли Чоем (исполнительный директор) и Томом Ли (операционный директор). Сейчас штат компании насчитывает 17 человек.
Инструменты компании позволяют создавать синтезированную речь для использования в самых разных сферах. По словам Ли, четыре основных рынка LOVO — это маркетинг, образование, развлекательный контент и AR/VR-продукты.
В прошлом году LOVO выпустила свой первый продукт LOVO Studio, который представляет собой простое в использовании приложение как для частных, так и для корпоративных клиентов. В нем можно создавать синтезированную озвучку контента с помощью выбранного из галереи подходящего голоса. Для разработчиков стартап также предлагает LOVO Voiceover API — его можно интегрировать в приложения для преобразования текста в человеческую речь в режиме реального времени. Еще один подсервис стартапа, LOVO DIY Voice Cloning, дает возможность пользователям синтезировать свой собственный голос — для этого нужно в течение 15 минут читать вслух предлагаемый сервисом текст.
В каталоге LOVO — более 200 голосовых скинов, классифицированных по языку, стилю, особенностям произношения, ситуативности и прочим параметрам. Пользователи могут выбрать скин на основе своих требований и потребностей под каждый конкретный запрос. По словам соучредителей, за время существования стартапа пользователи создали с помощью его инструментов более 5 миллионов записей голосового контента. Компания уже обслужила более 50 тысяч частных клиентов и около 50 крупных корпоративных клиентов, включая мировые киностудии.
Полученные новые инвестиции стартап планирует вложить в исследования и разработки в сфере синтеза речи с помощью ИИ, а также в расширение команды. По словам Ли, долгосрочная цель компании — разработать лучший продукт для синтеза речи, превосходящий все существующие на текущем рынке.