Staircase Traversal via Reinforcement Learning for Active Reconfiguration of Assistive Robots

Autor: Panagiotis Papadakis, Sao Mai Nguyen, Andrei Mitriakov, Serge Garlatti
Přispěvatelé: Lab-STICC_IMTA_CID_IHSEV, Laboratoire des sciences et techniques de l'information, de la communication et de la connaissance (Lab-STICC), École Nationale d'Ingénieurs de Brest (ENIB)-Université de Bretagne Sud (UBS)-Université de Brest (UBO)-École Nationale Supérieure de Techniques Avancées Bretagne (ENSTA Bretagne)-Institut Mines-Télécom [Paris] (IMT)-Centre National de la Recherche Scientifique (CNRS)-Université Bretagne Loire (UBL)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-École Nationale d'Ingénieurs de Brest (ENIB)-Université de Bretagne Sud (UBS)-Université de Brest (UBO)-École Nationale Supérieure de Techniques Avancées Bretagne (ENSTA Bretagne)-Institut Mines-Télécom [Paris] (IMT)-Centre National de la Recherche Scientifique (CNRS)-Université Bretagne Loire (UBL)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT), Département Informatique (IMT Atlantique - INFO), IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT), Unité d'Informatique et d'Ingénierie des Systèmes (U2IS), École Nationale Supérieure de Techniques Avancées (ENSTA Paris), Flowing Epigenetic Robots and Systems (Flowers), Inria Bordeaux - Sud-Ouest, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Unité d'Informatique et d'Ingénierie des Systèmes (U2IS), École Nationale Supérieure de Techniques Avancées (ENSTA Paris)-École Nationale Supérieure de Techniques Avancées (ENSTA Paris), The present work is performed in the context of the leadership program M@D (Chaire Maintien@Domicile), project REACT (Physical Interaction Models of Companion Robots) financed by Brest Mtropole and the region of Brittany (France) and supported by project VITAAL (Vaincre l’Isolement par les TIC pour l’Ambient Assisted Living), cofinanced by European Regional Fund (FEDER)., IEEE, Université de Brest (UBO)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-École Nationale Supérieure de Techniques Avancées Bretagne (ENSTA Bretagne)-Université Bretagne Loire (UBL)-Centre National de la Recherche Scientifique (CNRS)-Université de Bretagne Sud (UBS)-École Nationale d'Ingénieurs de Brest (ENIB)-Université de Brest (UBO)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-École Nationale Supérieure de Techniques Avancées Bretagne (ENSTA Bretagne)-Université Bretagne Loire (UBL)-Centre National de la Recherche Scientifique (CNRS)-Université de Bretagne Sud (UBS)-École Nationale d'Ingénieurs de Brest (ENIB)
Jazyk: angličtina
Rok vydání: 2020
Předmět:
Zdroj: 2020 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE)
2020 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE), Jul 2020, Glasgow, United Kingdom. ⟨10.1109/FUZZ48607.2020.9177581⟩
IEEE International Conference on Fuzzy Systems (FUZZ-IEEE)
IEEE International Conference on Fuzzy Systems (FUZZ-IEEE), Jul 2020, Glasgow, United Kingdom. ⟨10.1109/FUZZ48607.2020.9177581⟩
IEEE World Congress on Computational Intelligence
IEEE World Congress on Computational Intelligence, Jul 2020, Glasgow, United Kingdom
FUZZ-IEEE
Popis: International audience; Assistive robots introduce a new paradigm for developing advanced personalized services. At the same time, the variability and stochasticity of environments, hardware and unknown parameters of the interaction complicates their modelling , as in the case of staircase traversal. For this task, we propose to treat the problem of robot configuration control within a reinforcement learning framework, using policy gradient optimization. In particular, we examine the use of safety or traction measures as a means for endowing the learned policy with desired properties. Using the proposed framework, we present extensive qualitative and quantitative results where a simulated robot learns to negotiate staircases of variable size, while being subjected to different levels of sensing noise.
Databáze: OpenAIRE