Научно-исследовательская лаборатория Google DeepMind представила новую ИИ-модель AlphaGeometry. По утверждению разработчиков, она может решать геометрические задачи на уровне золотых медалистов Международной математической олимпиады.
Исходный код своей разработки лаборатория сделала открытым. Как следует из подробного разбора модели в британском научном журнале Nature, AlphaGeometry решает 25 из 30 олимпиадных задач по геометрии в рамках отведенного по стандарту времени (у среднестатистического медалиста этот показатель равен 25,9), в то время как модель предыдущего поколения могла решить всего 10 заданий за это же время.
Решение создать такой инструмент, направленный на геометрические вычисления, обусловлено мнением ученых-исследователей DeepMind: они считают, что поиск новых способов решения сложных геометрических задач является ключом к созданию более эффективных систем искусственного интеллекта. В частности, по их словам, AlphaGeometry может помочь открыть новые возможности в области математики, науки и ИИ благодаря своим способностям к доказыванию математических теорем и логическому рассуждению.
При разработке инструмента лаборатория объединила модель «нейронного языка», по архитектуре напоминающую ChatGPT, с «механизмом символического вывода», который использует правила (например, математические) для решений задач. Такие механизмы отличаются медленным и негибким форматом работы, особенно в случае обработки больших или сложных наборов данных, но в «тандеме» с нейронной моделью, которая «направляет» их на поиск наиболее вероятных ответов на заданные геометрические задачи, процесс идёт значительно быстрее и эффективнее.
Вместо использования сторонних обучающих данных DeepMind создала собственные «синтетические данные», сгенерировав 100 миллионов «синтетических теорем» и их доказательств различной сложности. Затем лаборатория обучила модель на этих данных с нуля, после чего протестировала ее на олимпиадных задачах по геометрии. Геометрические задачи в Международной математической олимпиаде основаны на диаграммах, в которые необходимо добавить «конструкции» (точки, линии или круги), прежде чем их можно будет решить. В AlphaGeometry, модель нейронного языка предсказывает, какие конструкции может быть полезно добавить, а символический механизм использует эти подсказки для поиска оптимальных решений. Таким образом, первая система предоставляет быстрые, «интуитивные» идеи, а вторая следом ищет наиболее рациональные решения.
Результаты решения задач с помощью AlphaGeometry также опубликованы в журнале Nature. В завершении статьи разработчики модели сообщают, что своей долгосрочной целью они видят создание ИИ-моделей, способных работать с различными областями математики и разрабатывать сложные методы решения задач, от которых будет зависеть развитие общих ИИ-систем будущего.
Источники: TechCrunch, DeepMind