Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen
  5. Projections for Approximate Policy Iteration Algorithms
 
  • Details
2022
Zweitveröffentlichung
Konferenzveröffentlichung
Verlagsversion

Projections for Approximate Policy Iteration Algorithms

File(s)
Download
Hauptpublikation
papi.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 3.88 MB
TUDa URI
tuda/8103
URN
urn:nbn:de:tuda-tuprints-205824
DOI
10.26083/tuprints-00020582
Autor:innen
Akrour, Riad
Pajarinen, Joni
Peters, Jan ORCID 0000-0002-5266-8091
Neumann, Gerhard
Kurzbeschreibung (Abstract)

Approximate policy iteration is a class of reinforcement learning (RL) algorithms where the policy is encoded using a function approximator and which has been especially prominent in RL with continuous action spaces. In this class of RL algorithms, ensuring increase of the policy return during policy update often requires to constrain the change in action distribution. Several approximations exist in the literature to solve this constrained policy update problem. In this paper, we propose to improve over such solutions by introducing a set of projections that transform the constrained problem into an unconstrained one which is then solved by standard gradient descent. Using these projections, we empirically demonstrate that our approach can improve the policy update solution and the control over exploration of existing approximate policy iteration algorithms.

Sprache
Englisch
Fachbereich/-gebiet
20 Fachbereich Informatik > Intelligente Autonome Systeme
DDC
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Veranstaltungstitel
36th International Conference on Machine Learning
Veranstaltungsort
Long Beach, California, USA
Startdatum der Veranstaltung
09.06.2019
Enddatum der Veranstaltung
15.06.2019
Buchtitel
Proceedings of the 36th International Conference on Machine Learning
Startseite
181
Endseite
190
Titel der Reihe
Proceedings of Machine Learning Research
Bandnummer der Reihe
97
Verlag
PMLR
Publikationsjahr der Erstveröffentlichung
2022
PPN
502453931
Ergänzende Ressourcen (Forschungsdaten)
https://github.com/akrouriad/papi

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.