Китайская ИИ-лаборатория DeepSeek выпустила две новейшие превью-версии своей большой языковой модели: V4 Flash и V4Pro. Предыдущая версия, модель V3.2, была выпущена в прошлом году.
- Оба инструмента построены на архитектуре Mixture of Experts (MoE) – она предполагает активацию ограниченного количества параметров на выполнение каждой задачи, что снижает затраты на вывод (т.е. на операционные расходы модели на обработку данных и вывод ответов). Контекстное окно у каждой модели составляет 1 миллион токенов – такой размер позволяет задавать в промпте обработку объёмных кодовых баз или многостраничных документов.
- Версия Pro имеет 1,6 трлн параметров (из них 49 млрд активных), благодаря чему является самой крупной моделью с открытым весом на данный момент. V4 Flash значительно «легче» – у неё 284 млрд параметров (13 млрд активных). По заявлению компании, оба варианта характеризуются гораздо более высоким уровнем производительности и эффективности по сравнению с V3.2 за счет улучшений в архитектуре, а также почти сравнялись с показателями производительности современных ведущих моделей по бенчмаркам.
- Лаборатория утверждает, что модель Pro превосходит GPT-5.2 от OpenAI и Gemini 3.0 Pro от Google в решении некоторых задач. В частности, в написании кода обе модели справились наравне с GPT-5.4. При этом DeepSeek слегка отстаёт от передовых моделей при тестировании на общую базу знаний – в данном случае её обогнали GPT-5.4 и Gemini 3.1 Pro. По подсчётам компании, модель сможет догнать своих конкурентов по этим показателям через 3-6 месяцев дальнейшего развития.
- И V4 Flash, и V4 Pro поддерживают только текст, чем отличаются от большинства аналогичных моделей с закрытым исходным кодом, которые помимо текста умеют распознавать и генерировать аудио, видео и картинки.
- Серия V4 также отличается большей доступностью по сравнению с другими передовыми генеративными моделями. У компактной V4 Flash расценки составляют $0,14 за миллион входных токенов и $0,28 за миллион выходных токенов. У более мощной V4 Pro эти цены составляют $0,145 и $3,48 соответственно. Это дешевле, чем стоимость за аналогичное количество токенов у некоторых версий Gemini, GPT и Claude.
Источник: TechCrunch

