Алгоритмы искусственного интеллекта, разработанные группой исследователей из Университета Беркли, Facebook и Университета Карнеги-Меллона, дали роботам лучшую способность адаптироваться и перемещаться в незнакомом месте в режиме реального времени. Теперь они могут преодолевать снег, дождь, жару и ночную тьму.
Первые шаги
Робот-испытатель успешно преодолел песок, пешеходные дорожки, высокую траву и груды грязи, не падая. Кроме того, он лучше других приспособился к тяжелому рюкзаку, брошенному на него, или к скользким, масляным склонам. Спускаясь по лестнице и преодолевая груды цемента и гальки.
Робот смог не только адаптироваться к новым обстоятельствам, но и сделать это за доли секунды. Это очень важный шаг в сфере практического применения.
Команда исследователей представит новую систему искусственного интеллекта под названием Rapid Motor Adaptation (RMA) на следующей неделе.
«Мы понимаем, что изменения происходят повсюду, поэтому с самого первого дня политика RMA предполагает, что окружающая среда изменится», — сказал Джитендра Малик, главный исследователь, профессор кафедры электротехники и компьютерных наук в Университете Беркли, и искусственный интеллект Facebook. исследовательская группа разведки. (FAIR) ученый.
Впечатляющая производительность
В прошлом роботы обычно были заранее запрограммированы на ожидаемые условия окружающей среды, с которыми они могли столкнуться, или обучены с использованием компьютерного моделирования и составленных вручную правил, которые диктовали их действия.
«Компьютерное моделирование не отражает всего», — сказал ведущий автор Ашиш Кумар, аспирант Университета Беркли из лаборатории Малика.
«Наш робот с RMA отлично адаптируется к беспрецедентной среде и учится этой адаптации, полностью взаимодействуя с окружающей средой и извлекая уроки из опыта. Это новое.»
Система RMA объединяет базовую политику — алгоритм, по которому робот определяет, как двигаться, — с модулем адаптации. Базовая политика использует обучение на основе подкрепления для управления внешними наборами переменных среды. Это можно узнать с помощью моделирования, но одного этого недостаточно, чтобы подготовить шагающего робота к реальному миру, поскольку встроенные в робота датчики не могут напрямую измерять все возможные переменные окружающей среды.
Чтобы решить эту проблему, модуль адаптации предписывает роботу изучать окружающую среду, используя информацию, основанную на движениях его собственного тела. Например, если робот чувствует, что его ноги удаляются, он может предположить, что поверхность, на которой он стоит, мягкая, и соответствующим образом адаптирует другие свои движения.
Базовый модуль политики и адаптации работает асинхронно и на разных частотах, поэтому RMA может надежно работать только с небольшим бортовым компьютером.