Компания по разработке ИИ-инструментов DeepMind, принадлежащая Google, представила свою новую разработку: модель, которую обучили играть в несколько 3D-игр. Она умеет оценивать условия игры, понимать устные инструкции игрока и в соответствии с ними совершать различные действия для достижения заданной цели.
Новинка получила название SIMA (scalable instructable multiworld agent – масштабируемый обучаемый мультимировой агент). Она обучалась на множестве часов видеороликов, демонстрирующих прохождение игрового процесса людьми. Никакого доступа к внутреннему коду игр или своду игровых правил инструмент при этом не получал. На основе полученных данных и аннотаций модель учится связывать между собой определенные визуальные репрезентации действий, объектов и взаимодействий между игроками. Также SIMA учится и на специально записанных видео, где игроки инструктируют друг друга по поводу прохождения игры.
Сам инструмент состоит из двух моделей: первая предназначена для обработки изображений и языка, вторая – видеомодель – предсказывает, что произойдет дальше на экране. Таким образом, для работы модели требуются всего две составляющие: демонстрация игры на экране и простые инструкции от пользователя на естественном языке. Управление центральным персонажем игры и выполнение действий SIMA осуществляет через клавиатуру и мышь.
На данный момент ИИ-агент знает чуть более 600 видов базовых действий, включая навигацию (например, повороты), взаимодействия с объектами (например, подъем по лестнице) и использование меню (например, просмотр карты). По информации из блога DeepMind, SIMA может выполнить набор простых задач примерно за 10 секунд.
Обучающие видеоролики для ИИ-агента были сняты по девяти 3D-играм по согласованности с их создателями. Одна из главных целей работы над инструментом, по заявлению разработчиков, заключалась в том, чтобы выяснить, сможет ли ИИ-инструмент, обученный играть в один набор игр, впоследствии играть в незнакомые ему игры благодаря полученным навыкам. Исходя из результатов, продемонстрированных SIMA, ответ оказался положительным.
Еще одной целью разработчики назвали создание более естественного игрового компаньона для геймеров в противовес тем инструментам, которые доступны сейчас. Отличительной характеристикой модели является её адаптивность и способность к интуитивному изучению правил при демонстрации незнакомой для неё игры благодаря использованию алгоритма обучения с подкреплением.
Как резюмируют разработчики инструмента в своем блоге, результаты, которые демонстрирует SIMA после обучения, указывают на потенциал в сфере разработки универсальных и управляемых языком игровых ИИ-агентов. По их ожиданиям, инструмент будет становиться всё более универсальным по мере дальнейшего обучения на разных игровых мирах, а с постепенным внедрением в него более продвинутых моделей будет улучшаться его способность понимать устные инструкции, что поможет достигать более сложные цели.