Французский ИИ-стартап Mistral обновил свое семейство ИИ-моделей Mistral 3. В него вошли 10 инструментов: одна большая основная модель с мультимодальными и мультиязычными возможностями и девять небольших моделей, которые можно настроить под конкретные задачи и использовать оффлайн.
- Семейство относится к разряду open-weight моделей – это означает, что их обученные параметры открыты для публичного доступа и использования.
- Основная модель, Mistral Large 3, построена на архитектуре из 675 миллиардов параметров, 41 миллиард из которых являются активными. Ее контекстное окно составляет 256 000 токенов, что открывает возможности для способностей к «рассуждению». В числе прочего, модель умеет обрабатывать объёмные документы и выполнять роль ИИ-агента для решения сложных задач. Инструмент может использоваться для анализа документов, генерации кода, создания контента, автоматизации рабочих задач и помощи пользователям в качестве ассистента.
- В семейство входят ещё девять моделей Ministral 3 меньшего масштаба. Они представлены в трех размерах (14, 8 и 3 миллиарда параметров) и трех вариациях: базовые (предварительно обученные настраиваемые модели), чат-боты (оптимизированные для диалога с пользователем и помощи в рабочих процессах) и модели со способностью рассуждения (способные решать сложные аналитические и логические задачи). Все варианты имеют контекстное окно от 128 000 до 256 000 токенов и поддерживают как минимум несколько мировых языков.
- Все небольшие модели могут работать на одном процессоре, благодаря чему их можно запускать на недорогом оборудовании, от ноутбуков до роботов, в том числе оффлайн.
- По мнению создателей, такой широкий спектр моделей даёт пользователям, разработчикам и организациям возможность выбирать наиболее подходящий вариант в зависимости от задачи, бюджета и возможностей.
Источник: TechCrunch

