Категории Нейросети и ИИ

Anthropic выпустила Claude Opus 4.8 и анонсировала Mythos

Anthropic выпустила Claude Opus 4.8 и анонсировала Mythos

Anthropic представила Claude Opus 4.8, новую версию своей флагманской модели, и одновременно анонсировала будущий запуск линейки «Mythos-class models». Opus 4.8 уже доступна всем клиентам по прежней цене: $5 за 1 млн входных токенов и $25 за 1 млн выходных. Компания делает акцент не на рекордном скачке качества, а на более узком обещании: модель должна чаще замечать собственные ошибки, реже делать необоснованные выводы и лучше вести себя в длинных агентных задачах.

По описанию Anthropic, Opus 4.8 улучшает результаты в агентном программировании и в сценариях, где модель управляет компьютером и выполняет цепочки действий. Главный тезис релиза другой. Компания продвигает модель как более «честную»: она чаще отмечает неопределенность в ответах и сигнализирует о слабых местах в данных или ходе анализа, а не маскирует их уверенным тоном.

В корпоративном сегменте это важнее очередного прироста в бенчмарках. Основные деньги генеративный ИИ сейчас получает в задачах, где модель пишет код, ищет ошибки и готовит рабочие материалы, а цена ложного уверенного ответа там выше, чем цена лишней секунды задержки. Не случайно и OpenAI, и Google за последний год вынесли агентные и «рассуждающие» режимы в отдельные продукты и настройки, пытаясь дать заказчикам больше контроля над тем, как именно модель тратит вычисления.

Вместе с Opus 4.8 Anthropic открыла research preview функции dynamic workflows. Она позволяет Claude разбивать сложные задачи, прежде всего программные, на множество параллельных подзадач и запускать для них сотни субагентов. Формулировка знакомая для рынка: поставщики ИИ все чаще продают не один ответ модели, а координацию целой «бригады» специализированных агентов.

Еще одно обновление выглядит как реакция на претензии к прошлой версии. В Claude появился переключатель effort control, через который пользователь вручную выбирает, сколько усилий и токенов модель должна потратить на задачу. Доступны режимы Low, Medium, High, Max, а также adaptive thinking. По умолчанию включен Low.

Это заметное изменение интерфейса продукта, хотя сама Anthropic оценивает прирост модели осторожно и называет его «умеренным, но ощутимым». Для компании такой тон неслучаен. На рынке, где каждая вторая модель объявляется «лучшей в мире», завышенные ожидания быстро возвращаются в виде жалоб пользователей и вопросов корпоративных клиентов о предсказуемости расходов.

Читайте также:

Claude Opus 4.7 и новый контроль усилий

Предшественник, Claude Opus 4.7, вышел чуть больше месяца назад. Ранний отклик оказался сдержанным. Часть пользователей жаловалась, что режим adaptive thinking не всегда верно распределяет усилия: на простых задачах модель иногда тратит слишком много времени, а на сложных не углубляется настолько, насколько от нее ждут.

Именно поэтому новый ручной контроль усилий выглядит не как косметическая доработка, а как попытка закрыть конкретную продуктовую дыру. В прикладных сценариях, особенно при работе с кодом, заказчику нужен не абстрактный «умнее», а понятный баланс между скоростью, стоимостью и качеством. Если модель каждый раз сама решает думать дольше, счет за токены начинает волновать даже тех, кто любит красивые демо.

У Anthropic есть и более широкий вызов. Компания пытается удержаться в числе лидеров на рынке, где OpenAI, Google и xAI обновляют модели почти непрерывно, а преимущества быстро обесцениваются. В инструментах для разработчиков давление еще выше: GitHub весной 2025 года сообщал о 15 млн пользователей Copilot, и это показывает масштаб спроса на ИИ для кода, но одновременно и цену ошибки для поставщика модели, который обещает автоматизацию без достаточной надежности.

На этом фоне анонс «Mythos-class models» работает сразу в двух плоскостях. С одной стороны, Anthropic подогревает интерес к следующему большому релизу и пытается не дать рынку обсуждать только косметический характер Opus 4.8. С другой, компания заранее выстраивает рамку безопасности и говорит, что более мощные модели требуют дополнительной проверки защитных механизмов из-за рисков в области кибербезопасности.

Anthropic не раскрыла точные параметры будущей линейки и ограничилась сроком «в ближайшие недели». Известно лишь, что речь идет о моделях, чьи возможности компания считает сопоставимыми с Mythos. В том же сообщении она подчеркивает, что Opus 4.8 снижает риск нежелательного поведения, включая генерацию вредоносного сексуального контента и действия, которые в системной карточке модели описаны как подрыв либеральной демократии.

Для Anthropic это удобная связка: текущий релиз продает надежность, будущий обещает мощность. Сработает ли она, станет ясно быстро. Компания сама сократила цикл обновлений до нескольких недель, а значит, проверять Mythos-класс будут уже не по заявлениям о безопасности, а по тому, даст ли он заметный прирост в коде и агентных задачах без роста цены выше нынешних $5 и $25 за миллион токенов.