Anthropic представила модели Claude Opus 4 и Claude Sonnet 4

Компания Anthropic анонсировала новые модели искусственного интеллекта Claude Opus 4 и Claude Sonnet 4, сделав акцент на прорыве в программировании, рассуждениях и агентных задачах. Обе модели уже доступны через API Anthropic, Amazon Bedrock и Google Cloud Vertex AI. Стоимость использования осталась прежней: $15/$75 за миллион токенов (ввод/вывод) для Opus 4 и $3/$15 — для Sonnet 4.
Claude Opus 4: мощнейшая модель для программирования
Opus 4 позиционируется как «лучшая в мире модель для программирования». Она обеспечивает стабильную работу в течение нескольких часов, справляется с многотысячными шагами в задачах, требующих концентрации, и подходит для построения сложных ИИ-агентов. По данным бенчмарков, Opus 4 занимает лидирующие позиции: 72,5 % на SWE-bench и 43,2 % на Terminal-bench. Это заметно выше показателей других моделей.
Opus 4 отличается высокой точностью и устойчивостью при изменении крупных кодовых баз. Например, Replit отметила серьёзные улучшения в работе с комплексными правками кода, а Cursor назвал Opus 4 новой планкой качества в области ИИ-программирования. Rakuten провела семичасовое тестирование в рамках open-source-проекта — модель показала стабильную производительность на всём протяжении работы.
Claude Sonnet 4: баланс возможностей и эффективности
Sonnet 4 — значительное обновление по сравнению с Sonnet 3.7. Она показывает результат 72,7 % на SWE-bench, улучшая точность, способность к рассуждению и выполнение инструкций. GitHub уже выбрала Sonnet 4 в качестве основной модели для нового кода-агента в Copilot.
Manus выделила точность и логичность Sonnet 4 при выполнении сложных запросов, а iGent подтвердила рост эффективности в автогенерации многокомпонентных приложений. По данным Sourcegraph, модель лучше удерживает фокус и создаёт более чистый и структурированный код. Augment Code отметила снижение ошибок навигации и увеличение доли успешных операций.

Новые функции и улучшения
Обе модели получили поддержку расширенного мышления с применением инструментов (в том числе веб-поиска), параллельное выполнение задач, улучшенное следование инструкциям и усовершенствованную работу с памятью при доступе к локальным файлам. В результате модели могут сохранять ключевые факты и поддерживать долгосрочный контекст — например, создавать «навигационные файлы» в ходе игр или сложных сценариев.
Для разработчиков доступен новый режим Developer Mode, позволяющий просматривать полные цепочки рассуждений моделей, а также включена функция Thinking Summaries — компактные сводки мыслительного процесса.
Поведение моделей стало на 65 % менее подвержено обходным методам выполнения задач по сравнению с Sonnet 3.7.

Claude Code выходит в общий доступ
Anthropic также выпустила Claude Code — среду для совместной работы с ИИ в разработке программного обеспечения. Инструмент получил интеграцию с VS Code и JetBrains: предложения по редактированию кода отображаются прямо в редакторе.
Кроме того, представлена SDK-версия Claude Code для разработки собственных ИИ-агентов. Бета-версия Claude Code на GitHub теперь позволяет автоматически отвечать на комментарии к pull request, исправлять ошибки CI и редактировать код по запросу. Установка доступна через команду /install-github-app в интерфейсе Claude Code.