Anthropic представила модели Claude Opus 4 и Claude Sonnet 4

9890d1bb39c15c41772af22d2282eb612469051c 2880x1620 1

Компания Anthropic анонсировала новые модели искусственного интеллекта Claude Opus 4 и Claude Sonnet 4, сделав акцент на прорыве в программировании, рассуждениях и агентных задачах. Обе модели уже доступны через API Anthropic, Amazon Bedrock и Google Cloud Vertex AI. Стоимость использования осталась прежней: $15/$75 за миллион токенов (ввод/вывод) для Opus 4 и $3/$15 — для Sonnet 4.

Содержание

1. Claude Opus 4: мощнейшая модель для программирования

2. Claude Sonnet 4: баланс возможностей и эффективности

3. Новые функции и улучшения

4. Claude Code выходит в общий доступ

Claude Opus 4: мощнейшая модель для программирования

Opus 4 позиционируется как «лучшая в мире модель для программирования». Она обеспечивает стабильную работу в течение нескольких часов, справляется с многотысячными шагами в задачах, требующих концентрации, и подходит для построения сложных ИИ-агентов. По данным бенчмарков, Opus 4 занимает лидирующие позиции: 72,5 % на SWE-bench и 43,2 % на Terminal-bench. Это заметно выше показателей других моделей.

Opus 4 отличается высокой точностью и устойчивостью при изменении крупных кодовых баз. Например, Replit отметила серьёзные улучшения в работе с комплексными правками кода, а Cursor назвал Opus 4 новой планкой качества в области ИИ-программирования. Rakuten провела семичасовое тестирование в рамках open-source-проекта — модель показала стабильную производительность на всём протяжении работы.

Claude Sonnet 4: баланс возможностей и эффективности

Sonnet 4 — значительное обновление по сравнению с Sonnet 3.7. Она показывает результат 72,7 % на SWE-bench, улучшая точность, способность к рассуждению и выполнение инструкций. GitHub уже выбрала Sonnet 4 в качестве основной модели для нового кода-агента в Copilot.

Manus выделила точность и логичность Sonnet 4 при выполнении сложных запросов, а iGent подтвердила рост эффективности в автогенерации многокомпонентных приложений. По данным Sourcegraph, модель лучше удерживает фокус и создаёт более чистый и структурированный код. Augment Code отметила снижение ошибок навигации и увеличение доли успешных операций.

6246b412f30444ce8e1e5746e226c56a743bd99f 2600x2118 1

Новые функции и улучшения

Обе модели получили поддержку расширенного мышления с применением инструментов (в том числе веб-поиска), параллельное выполнение задач, улучшенное следование инструкциям и усовершенствованную работу с памятью при доступе к локальным файлам. В результате модели могут сохранять ключевые факты и поддерживать долгосрочный контекст — например, создавать «навигационные файлы» в ходе игр или сложных сценариев.

Для разработчиков доступен новый режим Developer Mode, позволяющий просматривать полные цепочки рассуждений моделей, а также включена функция Thinking Summaries — компактные сводки мыслительного процесса.

Поведение моделей стало на 65 % менее подвержено обходным методам выполнения задач по сравнению с Sonnet 3.7.

09a6d5aa47c25cb2037efff9f486da4918f77708 3840x2304 1

Claude Code выходит в общий доступ

Anthropic также выпустила Claude Code — среду для совместной работы с ИИ в разработке программного обеспечения. Инструмент получил интеграцию с VS Code и JetBrains: предложения по редактированию кода отображаются прямо в редакторе.

Кроме того, представлена SDK-версия Claude Code для разработки собственных ИИ-агентов. Бета-версия Claude Code на GitHub теперь позволяет автоматически отвечать на комментарии к pull request, исправлять ошибки CI и редактировать код по запросу. Установка доступна через команду /install-github-app в интерфейсе Claude Code.