Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen (aus DeepGreen)
  5. Robust Reinforcement Learning: A Review of Foundations and Recent Advances
 
  • Details
2022
Zweitveröffentlichung
Artikel
Verlagsversion

Robust Reinforcement Learning: A Review of Foundations and Recent Advances

File(s)
Download
Hauptpublikation
make-04-00013-v2.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 1.34 MB
TUDa URI
tuda/8537
URN
urn:nbn:de:tuda-tuprints-211188
DOI
10.26083/tuprints-00021118
Autor:innen
Moos, Janosch ORCID 0000-0003-2484-3830
Hansel, Kay ORCID 0000-0002-8448-4510
Abdulsamad, Hany
Stark, Svenja
Clever, Debora
Peters, Jan
Kurzbeschreibung (Abstract)

Reinforcement learning (RL) has become a highly successful framework for learning in Markov decision processes (MDP). Due to the adoption of RL in realistic and complex environments, solution robustness becomes an increasingly important aspect of RL deployment. Nevertheless, current RL algorithms struggle with robustness to uncertainty, disturbances, or structural changes in the environment. We survey the literature on robust approaches to reinforcement learning and categorize these methods in four different ways: (i) Transition robust designs account for uncertainties in the system dynamics by manipulating the transition probabilities between states; (ii) Disturbance robust designs leverage external forces to model uncertainty in the system behavior; (iii) Action robust designs redirect transitions of the system by corrupting an agent’s output; (iv) Observation robust designs exploit or distort the perceived system state of the policy. Each of these robust designs alters a different aspect of the MDP. Additionally, we address the connection of robustness to the risk-based and entropy-regularized RL formulations. The resulting survey covers all fundamental concepts underlying the approaches to robust reinforcement learning and their recent advances.

Freie Schlagworte

reinforcement learnin...

robustness

min-max optimization

Sprache
Englisch
Fachbereich/-gebiet
16 Fachbereich Maschinenbau > Institut für Mechatronische Systeme im Maschinenbau (IMS)
20 Fachbereich Informatik > Intelligente Autonome Systeme
DDC
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
600 Technik, Medizin, angewandte Wissenschaften > 620 Ingenieurwissenschaften und Maschinenbau
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Titel der Zeitschrift / Schriftenreihe
Machine Learning and Knowledge Extraction
Startseite
276
Endseite
315
Jahrgang der Zeitschrift
4
Heftnummer der Zeitschrift
1
ISSN
2504-4990
Verlag
MDPI
Publikationsjahr der Erstveröffentlichung
2022
Verlags-DOI
10.3390/make4010013
PPN
500750009

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.