Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen
  5. Discrete-Time Mean Field Control with Environment States
 
  • Details
2021
Zweitveröffentlichung
Konferenzveröffentlichung
Postprint

Discrete-Time Mean Field Control with Environment States

File(s)
Download
Hauptpublikation
Cui_et_al_2021_Discrete-Time_Mean_Field_Control_with_Environment_States.pdf
Urheberrechtlich geschützt
Format: Adobe PDF
Size: 2.41 MB
TUDa URI
tuda/12847
URN
urn:nbn:de:tuda-tuprints-288560
DOI
10.26083/tuprints-00028856
Autor:innen
Cui, Kai ORCID 0000-0002-2605-0386
Tahir, Anam ORCID 0000-0002-5585-0948
Sinzger, Mark ORCID 0000-0003-4507-1622
Koeppl, Heinz ORCID 0000-0002-8305-9379
Kurzbeschreibung (Abstract)

Multi-agent reinforcement learning methods have shown remarkable potential in solving complex multi-agent problems but mostly lack theoretical guarantees. Recently, mean field control and mean field games have been established as a tractable solution for large-scale multi-agent problems with many agents. In this work, driven by a motivating scheduling problem, we consider a discrete-time mean field control model with common environment states. We rigorously establish approximate optimality as the number of agents grows in the finite agent case and find that a dynamic programming principle holds, resulting in the existence of an optimal stationary policy. As exact solutions are difficult in general due to the resulting continuous action space of the limiting mean field Markov decision process, we apply established deep reinforcement learning methods to solve the associated mean field control problem. The performance of the learned mean field control policy is compared to typical multi-agent reinforcement learning approaches and is found to converge to the mean field performance for sufficiently many agents, verifying the obtained theoretical results and reaching competitive solutions.

Freie Schlagworte

Manifolds

Limiting

Conferences

Process control

Reinforcement learnin...

Games

Aerospace electronics...

Sprache
Englisch
Fachbereich/-gebiet
18 Fachbereich Elektrotechnik und Informationstechnik > Institut für Nachrichtentechnik > Bioinspirierte Kommunikationssysteme
18 Fachbereich Elektrotechnik und Informationstechnik > Self-Organizing Systems Lab
DDC
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
600 Technik, Medizin, angewandte Wissenschaften > 621.3 Elektrotechnik, Elektronik
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Veranstaltungstitel
2021 60th IEEE Conference on Decision and Control (CDC)
Veranstaltungsort
Austin, TX, USA
Startdatum der Veranstaltung
14.12.2021
Enddatum der Veranstaltung
17.12.2021
Buchtitel
2021 60th IEEE Conference on Decision and Control (CDC)
Startseite
5239
Endseite
5246
ISBN
978-1-6654-3659-5
ISSN
2576-2370
Verlag
IEEE
Ort der Erstveröffentlichung
New York, NY
Publikationsjahr der Erstveröffentlichung
2021
Verlags-DOI
10.1109/CDC45484.2021.9683749
PPN
52524381X

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.