Стартап Anthropic, основанный выходцами из OpenAI и занимающийся разработкой генеративных ИИ-инструментов, выпустил обновленную версию своей модели для генерации текста Claude Instant, доступной через API.
По информации от стартапа, обновленная Claude Instant 1.2 включает в себя качества недавно выпущенной флагманской модели Anthropic, Claude 2: она умеет производить сложные математические вычисления, работать с кодом, рассуждать на заданные темы. Результаты внутреннего тестирования моделей инженерами компании показали, что обновленная модель на ~6% эффективнее справилась с задачей по написанию кода по сравнению со старой версией (58,7% против 52,8%), и примерно на столько же — с решением математических задач (86,7% против 80,9%).
В блоге компании говорится, что обновленный инструмент «генерирует более длинные и структурированные ответы и лучше следует инструкциям по форматированию», а также «показывает улучшенные навыки в извлечении цитат, обработке текстов на разных языках и ответах на различные вопросы».
Claude Instant 1.2 также менее склонна к так называемым «галлюцинациям», то есть выдаче неверных или лишенных смысла ответов. Была проведена работа и наш усилением безопасности инструмента — теперь он более устойчив к риску взлома, в особенности к «джейлбрейку» — в контексте LLM это метод, использующий искусно написанные команды для обхода функций безопасности, заложенных в больших языковых моделях их создателями.
Контекстное окно Claude Instant 1.2 — того же размера, что и в Claude 2: 100 000 токенов. Окно контекста — это размер текста, который модель способна проанализировать перед генерацией собственного текста, а токены означают части слов (например, слоги). Обе языковые модели способны проанализировать около 75 000 слов за один запрос — примерно столько же слов в «Великом Гэтсби».
Своей главной целью Anthropic считает создание «алгоритма нового поколения для самообучения ИИ» — его, по задумке разработчиков, можно будет использовать для создания разного рода виртуальных ассистентов, которые смогут помогать людям в офисной работе, научных исследованиях и даже создании произведений искусства.
Claude Instant таким алгоритмом не является — она больше предназначена для конкуренции с аналогичными генеративными моделями от OpenAI и других ИИ-стартапов. Стартап Anthropic, существующий всего 2 года, уже успел привлечь около 1,5 миллиарда долларов — но, по оценкам разработчиков, для создания чат-бота уровня ChatGPT компании понадобится 5 миллиардов долларов.
По утверждению компании, моделями Claude и Claude Instant в настоящее время пользуются «тысячи» клиентов и партнеров, в числе которых такие крупные сервисы, как Quora.
Источник: TechCrunch