Meta* обучает внутренний ИИ на данных о работе сотрудников

Meta* использует данные о том, как работают ее сотрудники, для обучения внутренних моделей искусственного интеллекта. Об этом сообщил глава компании Марк Цукерберг, объяснив подход желанием показать системам, как задачи решают «по-настоящему умные люди». На этом фоне решение выглядит двуслойно: в апреле компания объявила о сокращении около 10% штата, или примерно 7800 человек.
По словам Цукерберга, обучение на действиях собственных сотрудников оказалось эффективнее, чем привлечение внешних подрядчиков. Он прямо связал это с качеством выборки: средний уровень квалификации внутри Meta*, по его оценке, выше, чем у людей, которых компания может найти через аутсорсинговые каналы. Речь идет не о публичных пользовательских данных, а о внутренних рабочих процессах, которые компания превращает в материал для дообучения моделей.
Для индустрии это логичный сдвиг. После бума генеративного ИИ крупные разработчики столкнулись с удорожанием качественной разметки и дефицитом данных, пригодных для обучения агентных систем и корпоративных ассистентов. Scale AI, один из крупнейших поставщиков услуг по разметке, в 2024 году оценивался в 13,8 млрд долларов, а OpenAI, Google и Anthropic параллельно наращивали штаты исследователей и подрядчиков для тонкой настройки моделей. Meta*, судя по заявлению Цукерберга, делает ставку на более дорогой, но более точный внутренний источник.
Подход важен еще и потому, что рынок смещается от обучения на интернет-корпусах к данным о выполнении конкретных задач. Именно такие наборы нужны для ИИ, который должен писать код, модерировать контент, отвечать на внутренние запросы сотрудников или выполнять многошаговые действия в корпоративных сервисах. Microsoft и Google в последние 2 года также продвигали идею «рабочего» ИИ, встроенного в повседневные процессы, хотя публично намного осторожнее описывали, какие внутренние данные используют для обучения.
Отдельный вопрос связан не с качеством моделей, а с границами допустимого внутри компании. Если Meta* будет расширять такой способ обучения, ей придется точнее описывать, какие рабочие данные попадают в датасеты, кто имеет к ним доступ и как из них удаляют чувствительную информацию. Для рынка корпоративного ИИ это уже не техническая деталь: Gartner ожидала, что мировые расходы на генеративный ИИ в 2025 году превысят 600 млрд долларов, и значительная часть этих денег уходит именно в инструменты, работающие с внутренними знаниями и процессами компаний.
* Принадлежит компании Meta, она признана экстремистской организацией в РФ и её деятельность запрещена.



