ИИ-стартап Anthropic выпустил обновленную версию своей флагманской генеративной модели Opus 4.5. Чуть ранее до версии 4.5 были обновлены две другие модели стартапа: Sonnet и Haiku.
- Новый инструмент показал довольно продвинутые навыки в сферах генерации кода (по бенчмаркам SWE-bench и Terminal-bench), управления различными программами (по бенчмаркам tau2-bench и MCP Atlas) и общего умения решать задачи и находить ответы на вопросы (по бенчмаркам ARC-AGI 2 и GPQA Diamond). В частности, он стал первой ИИ-моделью, набравшей по SWE-bench более 80%.
- Opus 4.5 способен выполнять различные автоматизированные действия на компьютере пользователя и в частности в таблицах. Для демонстрации этих навыков стартап запустил несколько расширений для Chrome и Excel, которые пока доступны для корпоративного использования.
- Помимо этого, модель претерпела изменения касательно объёма памяти: у неё увеличилось контекстное окно, за счёт чего она может обрабатывать более длинные тексты. Для подписчиков платной версии появилась возможность «бесконечного чата»: это означает, что чат не будет прерываться, когда модель достигнет лимита контекстного окна. Вместо этого модель ужмет данные и продолжит работать без какого-либо уведомления пользователя.
- Как объясняет TechCrunch, большая доля обновлений Opus 4.5 разработана с расчетом на всевозможные сценарии использования ИИ-агентов, где сама модель выступает в роли ведущего агента, управляющего группой субагентов. В частности, для этого требуется большой объем памяти, навыки исследования кодовых баз и объемных документов, а также навыки перепроверки информации – всё это было учтено при обучении новой версии инструмента.
- Помимо Opus 4.5, в ноябре были выпущены обновления нескольких других крупных моделей – в частности, GPT 5.1 от OpenAI и Gemini 3 от Google.
Источник: TechCrunch

