В Китае представили новую ИИ-модель DeepSeek-R1

Китайский разработчик инструментов искусственного интеллекта DeepSeek представил новую ИИ-модель DeepSeek-R1. Она относится к моделям, наделенных так называемой «возможностью рассуждения» и, по заявлению создателей, может конкурировать с o1 от OpenAI.

Модели с возможностью рассуждения отличаются от обычных аналогов тем, что ищут ответы на запросы более тщательно и выполняют более эффективную проверку найденной информации. Это помогает им снижать количество ошибок и «галлюцинаций», но в то же время они обрабатывают запросы медленнее и тратят больше времени на поиск ответов. 

DeepSeek-R1 способна «рассуждать» на тему заданного вопроса, составлять план и выполнять ряд других действий, которые помогают прийти к верному ответу. Время обработки запроса зависит от его сложности – от нескольких секунд на легкие вопросы, до нескольких десяток секунд на сложные. 

Компания утверждает, что DeepSeek-R1 была протестирована на двух тестах для оценки эффективности ИИ-моделей – AIME и Math, и показала результаты, превышающие показатели модели o1-preview от OpenAI. 

Изображение: DeepSeek

При этом, как и любой новый продукт, модель не лишена изъянов: например, некоторые пользователи в соцсети X сообщили, что DeepSeek-R1 допускает ошибки в решении логических задач – в частности, неправильно играет в крестики-нолики (портал TechCrunch отмечает, что та же проблема отмечается и у o1). Также присутствуют комментарии, что у модели не до конца отрегулированы правила безопасности, и она может выдавать потенциально опасный контент.

Сейчас модель доступна на сайте компании в виде preview-версии: она бесплатна, но может обрабатывать до 50 запросов в день. В будущем разработчики планируют открыть исходный код DeepSeek-R1, а также выпустить API.