ИИ-лаборатория DeepMind (Google) открыла ограниченный платный доступ к тестированию своего нового ИИ-инструмента Project Genie, предназначенного для создания интерактивных игровых миров на основе текстовых промптов или визуальных референсов. Он объединяет в себе три мощных ИИ-модели: модель общего назначения Genie, генератор изображений Nano Banana и последнюю версию большой языковой модели Gemini.
- Чтобы создать игровой мир, нужно задать промпт с описанием главного героя и окружающей среды, в которой он будет находиться (в дальнейшем пользователь может исследовать этот мир от лица этого героя или со стороны). Затем Nano Banana генерирует изображения на основе заданных описаний, а Genie использует их как основу для создания интерактивного мира — но перед этим пользователь может отредактировать полученные изображения на свой вкус. Как сообщает TechCrunch, инструмент на данном этапе ещё не идеален и совершает ошибки — например, может проигнорировать заданные цвета (допустим, цвет волос героя может отличаться от указанного пользователем). В качестве альтернативы можно сразу загрузить в инструмент свои фотографии или картинки для референса.
- Через несколько секунд после загрузки изображений Project Genie уже выдаёт пользователю интерактивный мир, по которому можно передвигаться. Есть возможность брать за основу уже существующие миры из каких-либо игр и дополнять их на основе своих промптов, а также исследовать игровые миры других авторов, сохранённых в галерее. Свой авторский мир можно скачать в формате видео.
- На данный момент максимальная длительность каждого видео, сгенерированного инструментом, составляет 60 секунд. Ограничение объясняется типом модели Genie, поскольку её работа требует большой вычислительной мощности.
- В инструменте есть определенные ограничения для безопасности пользователей: например, нельзя создавать обнаженных персонажей. Кроме того, модель не генерирует персонажей или сцены из мультиков или игр Disney, так как эта корпорация запретила Google использовать свои материалы в создании генерированного контента.
- Как описывает журналист TechCrunch, протестировавший Project Genie, у инструмента есть свои плюсы и минусы. Из положительных сторон он выделяет качественную генерацию миров на основе креативных промптов, например в стиле аниме, акварельного рисунка или классического мультфильма. При этом генерация миров в реалистичном или кинематографическом стиле оставляет желать лучшего. Также, по его словам, модель хуже справляется с задачей, если в качестве референса использовать реальные фотографии.
- Как следует из обзора, на данный момент инструмент находится в стадии экспериментального прототипа; в дальнейшем компания планирует работать над усилением реалистичности изображений и расширением возможностей контроля пользователей над действиями и объектами в интерактивных мирах.
Источник: TechCrunch

