Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen
  5. Load Balancing in Compute Clusters With Delayed Feedback
 
  • Details
2023
Zweitveröffentlichung
Artikel
Verlagsversion

Load Balancing in Compute Clusters With Delayed Feedback

File(s)
Download
Hauptpublikation
Load_Balancing_in_Compute_Clusters_With_Delayed_Feedback.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 1.64 MB
TUDa URI
tuda/11281
URN
urn:nbn:de:tuda-tuprints-265367
DOI
10.26083/tuprints-00026536
Autor:innen
Tahir, Anam ORCID 0000-0002-5585-0948
Alt, Bastian ORCID 0000-0002-1522-5400
Rizk, Amr ORCID 0000-0002-9385-7729
Koeppl, Heinz ORCID 0000-0002-8305-9379
Kurzbeschreibung (Abstract)

Load balancing arises as a fundamental problem, underlying the dimensioning and operation of many computing and communication systems, such as job routing in data center clusters, multipath communication, Big Data and queueing systems. In essence, the decision-making agent maps each arriving job to one of the possibly heterogeneous servers while aiming at an optimization goal such as load balancing, low average delay or low loss rate. One main difficulty in finding optimal load balancing policies here is that the agent only partially observes the impact of its decisions, e.g., through the delayed acknowledgements of the served jobs. In this paper, we provide a partially observable (PO) model that captures the load balancing decisions in parallel buffered systems under limited information of delayed acknowledgements. We present a simulation model for this PO system to find a load balancing policy in real-time using a scalable Monte Carlo tree search algorithm. We numerically show that the resulting policy outperforms other limited information load balancing strategies such as variants of Join-the-Most-Observations and has comparable performance to full information strategies like: Join-the-Shortest-Queue, Join-the-Shortest-Queue(d) and Shortest-Expected-Delay. Finally, we show that our approach can optimise the real-time parallel processing by using network data provided by Kaggle.

Freie Schlagworte

Parallel systems

load balancing

partial observability...

Sprache
Englisch
Fachbereich/-gebiet
18 Fachbereich Elektrotechnik und Informationstechnik > Self-Organizing Systems Lab
DDC
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
600 Technik, Medizin, angewandte Wissenschaften > 621.3 Elektrotechnik, Elektronik
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Titel der Zeitschrift / Schriftenreihe
IEEE Transactions on Computers
Startseite
1610
Endseite
1622
Jahrgang der Zeitschrift
72
Heftnummer der Zeitschrift
6
ISSN
1557-9956
Verlag
IEEE
Ort der Erstveröffentlichung
[Erscheinungsort nicht ermittelbar]
Publikationsjahr der Erstveröffentlichung
2023
Verlags-DOI
10.1109/TC.2022.3215907
PPN
522453295
Ergänzende Ressourcen (Forschungsdaten)
https://github.com/AnamTahir7/Partially-Observable-Load-Balancer

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.