Стартап D-ID, создавший одну из популярных платформ для генерирования видеороликов с помощью ИИ, представил новый инструмент для автоматического перевода видео на другие языки. Он отличается тем, что сразу же воспроизводит автодубляж голосом говорящего в оригинале и изменяет движения его губ в соответствии с переведенными словами.
Технология основана на предыдущем проекте стартапа, который позволял анимировать фотографии, оживляя и озвучивая людей на фото.
В настоящее время инструмент может выполнять перевод на 30 языков, включая русский, испанский, французский, японский, арабский, хинди, и другие.
На данный момент инструмент может работать с видеороликами длиной от 10 секунд до 5 минут, а размер файла не должен превышать 2 ГБ. Перевод выполняется только на видео с одним человеком в кадре, а для наилучшего результата дубляжа его лицо должно смотреть прямо в камеру.
D-ID предполагает, что новая технология перевода видео может помочь корпоративным клиентам сэкономить расходы на локализацию своего видео-контента. Сейчас инструмент доступен для пользователей, имеющих платную подписку на платформу стартапа. Технология перевода видео будет также доступна разработчикам в виде API.
Источник: TechCrunch