Категории Нейросети и ИИ

Инженер программы чипов OpenAI перешёл в Anthropic

Инженер программы чипов OpenAI перешёл в Anthropic

Anthropic наняла Клайва Чана, одного из инженеров, работавших над программой собственных ИИ-чипов в OpenAI. Переход совпал с моментом, когда Anthropic, по данным Reuters, изучает возможность разработки собственных процессоров для снижения затрат на инференс и уменьшения зависимости от внешних поставщиков вычислений. Для рынка это не кадровая перестановка, а сигнал о том, что борьба между разработчиками моделей смещается в инфраструктуру.

О переходе Чан сообщил публично. В OpenAI он участвовал в ранней стадии проекта кастомного аппаратного обеспечения и, как следует из исходной информации, работал на стыке инженерии и взаимодействия с Broadcom, которая помогает крупным ИИ-компаниям в проектировании специализированных ускорителей. В своей публикации он отдельно упомянул плотность инженерной экспертизы в команде OpenAI и связал подобные чипы с будущими системами AGI.

Для Anthropic найм выглядит прикладным. Компания уже опирается на Google TPU и инфраструктуру Amazon, однако собственный кремний в такой схеме нужен не для имиджа, а для экономики. Основные расходы у генеративного ИИ все чаще приходятся не только на обучение, но и на массовый запуск уже готовых моделей. Чем дешевле один токен на выводе, тем легче продавать подписки и API без постоянного роста убытков.

На это указывает и профессиональный профиль самого Чана. Он использует формулировку perplexity per picojoule, то есть связывает качество модели с энергопотреблением вычислений. Такой фокус подходит и для оптимизации существующих ускорителей, и для проектирования специализированных процессоров под конкретные нагрузки. До OpenAI он работал в подразделении автопилота Tesla, где занимался энергоэффективными архитектурами для машинного обучения.

Собственные чипы Anthropic и OpenAI

Интерес Anthropic к собственным чипам укладывается в более широкий отраслевой сдвиг. Крупные разработчики моделей постепенно превращаются в покупателей и создателей вычислительной инфраструктуры. Еще несколько лет назад вопрос сводился к тому, кто получит больше GPU Nvidia. Теперь конкуренция идет за всю цепочку, от дата-центров и энергоснабжения до архитектуры ускорителей и системного софта.

Читайте также:

У крупных облачных игроков этот путь уже пройден частично. Google давно использует TPU в собственных сервисах и продает доступ к ним во внешнем облаке. Amazon развивает Trainium и Inferentia для обучения и инференса. Microsoft продвигает серию Maia для ИИ-нагрузок внутри Azure. Meta* также разрабатывает MTIA для рекомендательных систем и генеративных задач. На этом фоне зависимость только от сторонних GPU перестает выглядеть комфортной.

Есть и финансовая причина. В 2024 году мировой рынок ИИ-чипов оценивали более чем в $50 млрд, а к концу десятилетия аналитики ждут кратный рост за счет дата-центров и корпоративного ИИ. При такой динамике даже небольшое снижение себестоимости инференса дает эффект на миллиарды долларов в горизонте нескольких лет. Именно поэтому разработка собственного ускорителя из инженерной амбиции превращается в способ защитить маржу.

OpenAI шла тем же маршрутом. Компания, по данным американских СМИ, изучала проект собственного чипа вместе с Broadcom и параллельно искала способы сократить зависимость от внешних поставок ускорителей. Для нее это особенно чувствительно: масштаб ChatGPT и API-нагрузок требует постоянного расширения вычислительной базы, а стоимость производства передовых чипов и упаковки растет. Уход инженера из такой программы в Anthropic показывает, что борьба идет не только за пользователей и корпоративные контракты, но и за людей, способных собрать аппаратный стек с нуля.

Для самой Anthropic вопрос времени здесь не менее важен, чем вопрос технологий. Компания привлекала многомиллиардные инвестиции от Amazon и Google и строит бизнес вокруг крупных корпоративных заказчиков, где цена вывода модели и предсказуемость поставок вычислений становятся частью коммерческого предложения. Если проект собственных чипов выйдет из ранней стадии в полноценную программу, ответ рынка можно будет увидеть уже в ближайшие 12-18 месяцев по новым вакансиям, партнерствам с Broadcom или TSMC и структуре капитальных затрат.

* Принадлежит компании Meta, она признана экстремистской организацией в РФ и её деятельность запрещена.