MIT представил метод обучения роботов скрытым правилам

Исследователи MIT разработали метод обучения роботов, который позволяет учитывать не только прямую команду человека, но и неоговорённые ограничения. Система Masked Inverse Reinforcement Learning, или Masked IRL, по данным авторов, на 15% точнее распознаёт скрытые предпочтения пользователя и требует почти в 5 раз меньше демонстраций по сравнению с прежними подходами. Речь идёт о типовой проблеме сервисной робототехники: человек говорит «поставь чашку на стол», хотя реально ожидает, что робот не заденет ноутбук и не полезет слишком близко.
Подход состоит из двух этапов. Сначала языковая модель уточняет расплывчатую инструкцию на основе того, как человек показывал действие. Если оператор говорит «держись ближе», система может преобразовать это в более конкретное правило вроде «держись ближе к поверхности стола». Затем вторая модель разбирает сцену и отделяет важные объекты от случайных. Ноутбук, край стола или точка передачи предмета попадут в планирование, а лишние детали, не влияющие на задачу, будут отброшены.
MIT проверил метод в симуляции и на реальном манипуляторе. После обучения на 50 физических демонстрациях робот передавал предметы человеку, не сталкиваясь с ноутбуком, протирал стол с сохранением нужной траектории и подносил упаковку чипсов, избегая и пользователя, и мебели рядом. Следующий этап работы, как отмечают авторы, — подключение компьютерного зрения, чтобы робот сам выделял значимые объекты в кадре ещё до начала действия. Работу представят в июне на ICRA 2026 в Вене.
Это направление развивается быстро и без дефицита конкурентов. Google DeepMind и Toyota Research Institute в последние годы показывали системы, которые учат роботов по видео и естественным командам, а Figure AI и Boston Dynamics делают ставку на работу машин рядом с людьми в складах и на производстве. По оценке Fortune Business Insights, мировой рынок сервисной робототехники может превысить $80 млрд к концу десятилетия, и способность робота понимать «недосказанное» в такой гонке перестаёт быть академической деталью. Для бытовых и офисных машин это вопрос не только удобства, но и безопасности, которая обычно вспоминается уже после первого неловкого движения манипулятора.



