Алленовский институт искусственного интеллекта (The Allen Institute for AI), занимающийся исследованиями в области машинного обучения, объявил о своей работе над созданием новой системы ИИ под названием Unified-IO. Как сообщает портал TechCrunch, нейросеть способна выполнять “широкий и разнообразный набор задач”. Например, она может генерировать и обрабатывать изображения и текст, а также работать с разными видами структурированных данных.
По словам исследовательской команды института, эта разработка является еще одним шагом к созданию продвинутых и унифицированных ИИ-систем общего назначения.
Мы заинтересованы в создании систем ИИ, с помощью которых можно будет обучать модели машинного обучения новым задачам, практически не зная лежащего в их основе механизма. Такие унифицированные архитектуры уменьшают потребность в модификациях системы и выставлении параметров для конкретных задач, их можно обучать выполнению большого количества задач, а также они могут обмениваться знаниями между собой для повышения производительности.
Джейсен Лу
Unified-IO имеет общие характеристики с алгоритмом обработки естественного языка GPT-3 от OpenAI, так как они оба имеют архитектуру Transformer, разработанную в 2017 году. Эта архитектура используется в системах, предназначенных для решения сложных задач.
Unified-IO учится на примерах в виде токенов, предоставляющих системе миллиарды слов, изображений и других единиц информации в понятном ей виде.
Среди задач, которые может выполнять Unified-IO — создание изображений, обнаружение объектов на изображениях, перефразирование текста, выделение определенных областей на фотографиях. В отличие от некоторых аналогичных систем, анализировать или генерировать видео и аудио Unified-IO пока не умеет.
Нейросеть во многом похожа на недавно созданную ИИ-систему Gato от лаборатории DeepMind, которую обучили выполнению более 600 задач, от игры в приставку до управления роботами. (Подробнее о Gato можно прочитать здесь).
Научные сотрудники Алленовского института планируют продолжать работу над Unified-IO и повышать её эффективность. В частности, в число планов входит обучение нейросети работе с аудио- и видео-форматами, а также масштабирование системы для повышения производительности.