QwQ-32B-Preview – новая ИИ-модель с «возможностью рассуждения» от китайской компании Alibaba

Китайская компания Alibaba выпустила превью-версию новой экспериментальной исследовательской ИИ-модели QwQ-32B-Preview.    Она оснащена «возможностью рассуждения» и превосходит аналогичную модель от OpenAI по некоторым параметрам.

Модель построена на базе семейства больших языковых моделей Qwen от Alibaba. Она содержит 32,5 миллиарда параметров, а её контекстное окно  составляет 32,768 токенов. Согласно заявлению разработчиков, инструмент превзошел аналогичные модели o1-preview и o1-mini от OpenAI в тестах на производительность (AIME и MATH). Однако стоит уточнить, что количество параметров у двух упомянутых моделей OpenAI не раскрывает.

QwQ-32B-Preview способна решать логические задачи, находить ответы в головоломках и вычислять сложные математические примеры.  

Изображение: Hugging Face

При этом, компания открыто перечислила недостатки модели, над которыми продолжает вестись работа: в частности, инструмент может внезапно переключаться на другой язык, застревать в «циклах рассуждений», выдавать небезопасный контент, а также плохо справляться с вопросами, ответы на которые требуют наличие человеческого опыта или понимания языковых нюансов.

Благодаря «возможности рассуждения», модель может эффективно проверять свои же ответы, но при этом она тратит больше времени на поиск информации. Принцип её работы в целом похож на ещё одну недавно выпущенную китайскую ИИ-модель от DeepSeek, про которую мы писали в прошлой статье

QwQ-32B-Preview доступна для загрузки на платформе Hugging Face. Доступ к ней открыт по лицензии Apache 2.0, что позволяет использовать, изменять и распространять инструмент с обязательным указыванием исходного авторства. При этом, на данный момент модель выпущена не в полном виде – пользователям доступны только некоторые её компоненты, поэтому получить глубокое представление о внутренней работе системы невозможно. 

Источник: TechCrunch