Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen
  5. Learning Discrete-Time Major-Minor Mean Field Games
 
  • Details
2024
Zweitveröffentlichung
Konferenzveröffentlichung
Postprint

Learning Discrete-Time Major-Minor Mean Field Games

File(s)
Download
Hauptpublikation
Cui_et_al_2024_Learning_Discrete-Time_Major-Minor_Mean_Field_Games.pdf
Urheberrechtlich geschützt
Format: Adobe PDF
Size: 880.58 KB
TUDa URI
tuda/12723
URN
urn:nbn:de:tuda-tuprints-286878
DOI
10.26083/tuprints-00028687
Autor:innen
Cui, Kai ORCID 0000-0002-2605-0386
Dayanıklı, Gökçe
Laurière, Mathieu
Geist, Matthieu
Pietquin, Olivier
Koeppl, Heinz ORCID 0000-0002-8305-9379
Kurzbeschreibung (Abstract)

Recent techniques based on Mean Field Games (MFGs) allow the scalable analysis of multi-player games with many similar, rational agents. However, standard MFGs remain limited to homogeneous players that weakly influence each other, and cannot model major players that strongly influence other players, severely limiting the class of problems that can be handled. We propose a novel discrete time version of major-minor MFGs (M3FGs), along with a learning algorithm based on fictitious play and partitioning the probability simplex. Importantly, M3FGs generalize MFGs with common noise and can handle not only random exogeneous environment states but also major players. A key challenge is that the mean field is stochastic and not deterministic as in standard MFGs. Our theoretical investigation verifies both the M3FG model and its algorithmic solution, showing firstly the well-posedness of the M3FG model starting from a finite game of interest, and secondly convergence and approximation guarantees of the fictitious play algorithm. Then, we empirically verify the obtained theoretical results, ablating some of the theoretical assumptions made, and show successful equilibrium learning in three example problems. Overall, we establish a learning framework for a novel and broad class of tractable games.

Sprache
Englisch
Fachbereich/-gebiet
18 Fachbereich Elektrotechnik und Informationstechnik > Self-Organizing Systems Lab
DDC
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
600 Technik, Medizin, angewandte Wissenschaften > 621.3 Elektrotechnik, Elektronik
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Veranstaltungstitel
38th AAAI Conference on Artificial Intelligence
Veranstaltungsort
Vancouver, Canada
Startdatum der Veranstaltung
20.02.2024
Enddatum der Veranstaltung
27.02.2024
Buchtitel
Proceedings of the 38th AAAI Conference on Artificial Intelligence
Titel der Zeitschrift / Schriftenreihe
Proceedings of the AAAI Conference on Artificial Intelligence
Startseite
9616
Endseite
9625
Jahrgang der Zeitschrift
38
Heftnummer der Zeitschrift
9
ISBN
978-1-57735-887-9
ISSN
2374-3468
Verlag
AAAI
Ort der Erstveröffentlichung
Menlo Park, Calif.
Publikationsjahr der Erstveröffentlichung
2024
PPN
52524378X

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.