Китайская компания Tencent представила обновленную модель DynamiCrafter для генерации видео

Китайская компания Tencent, разработавшая мессенджер WeChat и ряд популярных видеоигр, представила обновленную версию своей модели для генерации видео DynamiCrafter. Она опубликована на GitHub с открытым исходным кодом.

  • Как и многие генеративные модели для создания видео, DynamiCrafter использует метод диффузии для превращения текстовых подсказок и статичных изображений в видеоролики длиной в несколько секунд.
  • Первая версия инструмента была выпущена в октябре прошлого года: модель этого образца умела генерировать видео с разрешением 320 x 512р. Новая версия создает видео с разрешением 640 x 1024р. Команда разработчиков DynamiCrafter также опубликовала приуроченную к выходу модели статью, в которой отмечается, что инструмент отличается от конкурентных моделей тем, что благодаря применению более расширенного спектра методов анимации изображений позволяет создавать более реалистичный визуальный контент.
  • Из обзора модели на портале TechCrunch следует, что при сравнении трёх аналогичных инструментов (DynamiCrafter, Stable Video Diffusion и Pika Labs), сгенерированное с помощью DynamiCrafter видео действительно выглядит немного более естественным. При этом в статье подчеркивается, что подобные ИИ-модели всё ещё далеки от создания длительных полноценных роликов, которые было бы невозможно отличить от реального видео.
  • Публикация демо-версий генеративных моделей на GitHub с открытым исходным кодом становится всё более популярной стратегией продвижения ИИ-инструментов среди китайских технологических компаний. В частности, за последнее время таким же образом представили свои модели для создания видео ByteDance, Baidu и Alibaba.