Human Archive привлекла $8,2 млн на сбор данных с камер

Американско-китайский стартап Human Archive привлек $8,2 млн посевных инвестиций на создание наборов данных для ИИ с помощью носимых камер, которые закрепляют на работниках в Индии и других странах. Раунд поддержали Wing Venture Capital, NVP Capital, Y Combinator и несколько частных инвесторов, связанных с OpenAI, Nvidia, Google и Meta*. Проект работает на стыке двух быстрорастущих рынков: обучения моделей для «воплощенного» ИИ и автоматизации ручного труда.
По данным TechCrunch, компания использует около 1 тыс. устройств и собирает видео в жилых домах, ресторанах, гостиницах, на стройках, в логистике и на промышленных площадках. В материалах самой Human Archive говорится о двух типах датасетов: трехмерной записи окружающей среды с камеры на визоре и двухмерной съемке движений рук с камер на запястьях. Сооснователь Радж Патель называет их «базовой инфраструктурой» для моделирования человеческого сенсомоторного интеллекта.
Формально стартап продает не систему наблюдения и не готовую робототехнику, а сырье для будущих моделей. Однако прикладной сценарий считывается без труда. В публикации в X Патель написал, что технология должна стать основой для автоматизации ручного труда и «нового рынка труда». Это важная оговорка на фоне вирусного ролика из Индии, где рабочие швейного производства якобы носили похожие мини-камеры на голове. Подтвердить связь между тем видео и Human Archive нельзя, но сам раунд показывает, что Кремниевая долина готова финансировать подобный сбор данных.
Ставка инвесторов объяснима не только интересом к роботам-гуманоидам. Для «воплощенного» ИИ остро не хватает данных о том, как человек взаимодействует с предметами, инструментами и пространством. Крупные языковые модели обучались на интернет-тексте, а роботу для работы на складе или кухне нужны другие массивы: как человек берет коробку, открывает дверь, двигается в узком проходе, меняет хват и корректирует движение в реальном времени. Именно такие данные Human Archive пытается собирать в полевых условиях, а не в лаборатории.
Human Archive и датасеты для ИИ
Идея обучать модели на видео «от первого лица» не нова. Еще в 2021 году Meta* запустила академический проект Ego4D, один из крупнейших открытых наборов эгоцентрических видео, куда вошли тысячи часов записи от сотен участников из нескольких стран. Разница в том, что академические датасеты обычно ограничены исследовательскими задачами и добровольным участием, а Human Archive строит коммерческую систему массового сбора данных на рабочих местах.
Интерес к этому сегменту заметно вырос вместе с бумом гуманоидной робототехники. Figure AI в 2024 году привлекла $675 млн от пула инвесторов, куда вошли Microsoft, OpenAI, Nvidia и Джефф Безос. Стартап Physical Intelligence в том же году получил $400 млн на разработку универсального ПО для роботов. На этом фоне рынок данных для физических действий выглядит как следующий слой инфраструктуры: без него роботам сложно выйти за пределы демонстраций на складе или в лаборатории.
Вокруг такого сбора данных неизбежно возникает вопрос о труде и согласии работников. Human Archive не раскрыла, с какими именно платформами и работодателями в Индии она сотрудничает, хотя TechCrunch указывает на партнерства с участниками местной gig-экономики. Это чувствительная зона. В отличие от разметки текста и изображений, где подрядчики обычно работают удаленно, здесь речь идет о постоянной записи физической работы, маршрутов и моторики человека. Для компаний это ценный датасет, для работников это дополнительные риски контроля и переиспользования данных.
Сами основатели пытаются сместить акцент с замены людей на более широкую задачу понимания «воплощенного интеллекта». Они утверждают, что не хотят ограничиваться текущими возможностями роботов и собирают материал для более общей модели человеческого взаимодействия с физическим миром. Но эта формулировка мало меняет экономику проекта. Если удастся стандартизировать данные о движении рук, взгляде и действиях в реальной среде, ближайшим покупателем почти наверняка станут разработчики промышленной автоматизации, сервисных роботов и логистических систем.
У Human Archive есть и операционное преимущество перед университетскими проектами. Компания строит собственный парк устройств и, по сути, вертикально интегрирует сбор данных. Это дает контроль над форматом записи, качеством сенсоров и масштабированием. В этой логике стартап ближе к Scale AI или Surge AI, только вместо текстов и изображений он пытается поставить на поток сенсомоторные данные.
- Раунд: $8,2 млн seed
- Инвесторы: Wing Venture Capital, NVP Capital, Y Combinator
- Парк устройств: около 1 тыс. носимых камер
- Среды сбора: дома, рестораны, стройки, логистика, промышленность
- Типы данных: 3D-сцена и 2D-движения рук
Для рынка это сигнал о смещении интереса инвесторов от «мозга» ИИ к «телу». За последние два года венчурный капитал активно финансировал большие модели, а теперь деньги все чаще идут в инструменты, которые позволяют перенести ИИ в физический мир. Вопрос не в том, можно ли собрать такие данные, а в том, удастся ли превратить их в стандарт для индустрии. Ответ начнет проясняться в 2026-2027 годах, когда разработчики гуманоидов и складских роботов попытаются выйти из пилотов в серийные внедрения.
* Принадлежит компании Meta, она признана экстремистской организацией в РФ и её деятельность запрещена.



