Гути Л.
Интеграция обучения с подкреплением (RL) и робототехники успешно применяется в различных промышленных условиях. Одно из таких условий включает развертывание сейсмических датчиков на обширных нефтяных и газовых месторождениях. Проблема развертывания датчиков может быть сформулирована как сложная задача оптимизации, в которой могут эффективно использоваться марковские процессы принятия решений (MDP). Наш робот на основе RL может развертывать сейсмические датчики на мягких и шероховатых участках, охватывающих обширные нефтяные/газовые месторождения. Наш прототип робота является результатом инновационной работы, которая в настоящее время защищена двумя опубликованными патентами США [1, 2]. Демонстрацию возможностей робота можно найти в [3, 4].