Mistral выпустил обновленное семейство ИИ-моделей Mistral 3

Французский ИИ-стартап Mistral обновил свое семейство ИИ-моделей Mistral 3. В него вошли 10 инструментов: одна большая основная модель с мультимодальными и мультиязычными возможностями и девять небольших моделей, которые можно настроить под конкретные задачи и использовать оффлайн. 

  • Семейство относится к разряду open-weight моделей – это означает, что их обученные параметры открыты для публичного доступа и использования. 
  • Основная модель, Mistral Large 3, построена на архитектуре из 675 миллиардов параметров, 41 миллиард из которых являются активными. Ее контекстное окно составляет 256 000 токенов, что открывает возможности для способностей к «рассуждению». В числе прочего, модель умеет обрабатывать объёмные документы и выполнять роль ИИ-агента для решения сложных задач. Инструмент может использоваться для анализа документов, генерации кода, создания контента, автоматизации рабочих задач и помощи пользователям в качестве ассистента. 
  • В семейство входят ещё девять моделей Ministral 3 меньшего масштаба. Они представлены в трех размерах (14, 8 и 3 миллиарда параметров) и трех вариациях: базовые (предварительно обученные настраиваемые модели), чат-боты (оптимизированные для диалога с пользователем и помощи в рабочих процессах) и модели со способностью рассуждения (способные решать сложные аналитические и логические задачи). Все варианты имеют контекстное окно от 128 000 до 256 000 токенов и поддерживают как минимум несколько мировых языков. 
  • Все небольшие модели могут работать на одном процессоре, благодаря чему их можно запускать на недорогом оборудовании, от ноутбуков до роботов, в том числе оффлайн. 
  • По мнению создателей, такой широкий спектр моделей даёт пользователям, разработчикам и организациям возможность выбирать наиболее подходящий вариант в зависимости от задачи, бюджета и возможностей. 

Источник: TechCrunch