Французский стартап Mistral AI запустил большую языковую модель с открытым исходным кодом

Mistral AI – французский стартап в области искусственного интеллекта, созданный выходцами из ИИ-лаборатории DeepMind от Google – выпустил свою первую языковую модель Mistral 7B. Доступ к основным её функциям компания сделала бесплатным.

Летом этого года Mistral Al вызвал ажиотаж в мире технологических новостей, собрав $113 млн в ходе посевного раунда финансирования и достигнув общей оценки в размере $260 млн, ещё не представив на тот момент даже демо-версию своего первого продукта. Теперь же компания официально объявила о запуске модели Mistral 7B, которая, по утверждению её разработчиков, превосходит по функционалу и способностям другие модели такого же размера, а доступ к ней можно получить бесплатно.

Модель выпущена под лицензией Apache 2.0 — она даёт пользователю право использовать программное обеспечение для любых целей, а также свободно изменять или распространять его измененные копии с условием указания авторства оригинального продукта. Это означает, что разработкой Mistral могут пользоваться все, от обычных пользователей до крупных корпораций и государственных организаций, если у них есть система, где можно запустить модель локально или на облачном ресурсе.

Mistral 7B можно скачать различными способами, в том числе через репозиторий GitHub. Также компания запустила канал на Discord для связи с пользователями и совместной работы над устранением неполадок.

Модель можно назвать более усовершенствованной версией ранее вышедших больших языковых моделей «малого формата», так как она выполняет аналогичный им набор функций при значительно меньших вычислительных затратах. Крупные модели вроде GPT-4 оснащены гораздо более широким набором возможностей, но и намного более сложны в эксплуатации.

В анонсе запуска модели в своем блоге стартап сообщил, что ставит перед собой цель развивать сферу генеративного ИИ с открытым исходным кодом и довести открытые модели до высочайшего уровня производительности:

«Характеристики Mistral 7B демонстрируют, на что способны небольшие модели при достаточном упорстве. Это результат трёх месяцев интенсивной работы, в ходе которой мы собрали команду и с нуля разработали сложнейший конвейер обработки данных».

Для организаций или специалистов, которые заходят более глубоко изучить продукт, будет доступен дополнительный платный набор инструментов.

Источник: TechCrunch