Benchmarking von Verhaltens-Algorithmen für die Applikation in Motorsport-Szenarien

Sippel, Marco (2022)
Benchmarking von Verhaltens-Algorithmen für die Applikation in Motorsport-Szenarien.
Technische Universität Darmstadt
doi: 10.26083/tuprints-00020463
Ph.D. Thesis, Primary publication, Publisher's Version

Text
20220203_dissertation_sippel.pdf
Copyright Information: CC BY-SA 4.0 International - Creative Commons, Attribution ShareAlike.
Download (4MB)

Item Type:

Ph.D. Thesis

Type of entry:

Primary publication

Title:

Benchmarking von Verhaltens-Algorithmen für die Applikation in Motorsport-Szenarien

Language:

German

Referees:

Winner, Prof. Dr. Hermann ; Adamy, Prof. Dr. Jürgen

Date:

2022

Place of Publication:

Darmstadt

Collation:

XXII, 179 Seiten

Date of oral examination:

13 January 2022

DOI:

10.26083/tuprints-00020463

Abstract:

Im Zuge der Entwicklung des autonomen Fahrens existieren Bemühungen, den Motorsport als Technologie-Treiber und Showcase in diese Entwicklung mit einzubinden. Die Herausforderungen, die der Motorsport für die autonome Fahrt präsentiert, sind vielfältig und beinhalten neben der Wahrnehmung der Umwelt bei hohen Geschwindigkeiten auch die Regelung des Fahrzeugs und die Trajektorienplanung. Während die Trajektorienplanung für ein einzelnes Fahrzeug eine von vielen Autoren untersuchte Aufgabe ist, existieren für die Verhaltensplanung der Interaktion von mehreren Fahrzeugen bislang nur wenige Ansätze. Diese Ansätze basieren häufig auf unterschiedlichen Prinzipien und Fahrzeugmodellen. Somit ist die Evaluation häufig zwar nachvollziehbar, aber nicht auf andere Methoden extrapolierbar. Diese Arbeit startet daher mit der initialen Frage, wie und unter welchen Bedingungen möglich ist, verschiedene Algorithmen, die Verhalten für autonome Rennfahrzeugen erzeugen, miteinander zu vergleichen.

Die Analyse des Stands der Forschung offenbart, dass bisherige Ansätze für den Vergleich bislang häufig auf Reward-Funktionen aus dem Bereich des maschinellen Lernens zurückgreifen oder Metriken für die Evaluation nutzen, deren Relevanz für das betrachtete Szenario nicht genauer untersucht wird. Bestehende Ranking-Verfahren bieten die Möglichkeit, große Zahlen an menschlichen Spielern in eine Rangfolge zu bringen. Für Computeralgorithmen existieren dagegen aufgrund von Überlegenheiten nach dem Schere-Stein-Papier-Prinzip unterschiedlicher Strategien nur Methoden für kleine Anzahlen an Spielern.

Auf Basis der Analyse von Benchmarkings und den im Motorsport verfolgten Zielen werden die Randbedingungen für ein Szenario anhand der Szenario-Definition von Ulbricht et al. mit Bezug auf eine qualitative Analyse und eine quantitative Einordnung diskutiert. Danach wird eine Methode vorgestellt, die genutzt werden kann, um auch eine Vielzahl an Algorithmen in einer Rangfolge anzuordnen. Eine vorgeschlagene Methode, die versucht, einzelne Testergebnisse zu prognostizieren und die Ergebnisse des Rankings in einem allgemein definierten Szenario offenbaren die Schwachstellen der untersuchten Verhaltensalgorithmen. Die Erstellung einer Rangfolge ist danach nur unter der Bedingung möglich, dass ein konkretes Test-Szenario definiert ist. Ein allgemeingültiger direkter Vergleich ist, aufgrund mangelnder Vergleichbarkeit für breite Parametervariationen, nicht möglich.

Diese Arbeit präsentiert ein umfassendes Konzept, um Verhaltensalgorithmen zu analysieren und weiterzuentwickeln. Das vorgestellte Ranking-Verfahren erlaubt außerdem die Bildung einer Rangfolge bei Voraussetzung eines im Vorfeld definierten Testszenarios. Für die Evaluierung des Bewertungsverfahrens wird ein Trajektorienplaner entwickelt und umgesetzt. Bedingt durch die kurzen Berechnungszeiten wird die Kombination des modellprädiktiven Planers mit einem neuronalen Netz ermöglicht. Auf diese Weise eröffnet sich das Feld der Verhaltensoptimierung durch maschinelles Lernen, das durch besonders hohe Anzahl zu berechnender Zeitschritte mit anderen Ansätzen der Trajektorienberechnung keine praktikable Umsetzung bietet. Auf diese Weise wird ein Agent implementiert, der die Aufgabe erfüllt, ein anderes Fahrzeug am Überholen zu hindern und auch ein Überholen zu ermöglichen. Der vorgestellte deterministische Ansatz für das Problem aggressive Überholmanöver auszuführen, zeigt in der ersten Analyse eine vielversprechende Performance. Allerdings treten für den Ansatz bei der Fahrt auf realen Streckenlayouts noch eine hohe Anzahl an Kollisionen auf.

Alternative Abstract:

Alternative Abstract

Language

As autonomous driving develops, efforts exist to incorporate motorsports into this development as a technology driver and showcase. The challenges presented by motorsports for autonomous driving are many and include vehicle control and trajectory planning in addition to perception of the environment at high speeds. While trajectory planning for a single vehicle is a task studied by many authors, few approaches exist to date for behavioral planning of the interaction of multiple vehicles. These approaches are often based on different principles and vehicle models. Thus, the evaluation is often comprehensible but not extrapolable to other methods. This work therefore starts with the initial question of how and under which conditions it is possible to compare different algorithms that generate behavior for autonomous racing vehicles.

The analysis of the state of the art reveals that previous approaches for comparison so far often rely on reward functions from the field of machine learning or use metrics for evaluation whose relevance for the scenario under consideration is not investigated in more detail. Existing ranking methods offer the possibility to rank large numbers of human players. For computer algorithms, on the other hand, only methods for small numbers of players exist due to superiority based on the rock-paper-scissors principle of different strategies.

Based on the analysis of benchmarks and the goals pursued in motorsports, the boundary conditions for a scenario are discussed using the scenario definition of Ulbricht et al. with reference to a qualitative analysis and a quantitative ranking. A method is then presented that can be used to rank even a large number of algorithms. A proposed method that attempts to predict individual test results and the results of ranking in a generally defined scenario reveal the weaknesses of the behavioral algorithms studied. According to this, ranking is possible only under the condition that a concrete test scenario is defined. A generally valid direct comparison is not possible due to the lack of comparability for broad parameter variations.

This work presents a comprehensive concept to analyze and further develop behavioral algorithms. The presented ranking procedure also allows the formation of a ranking given a predefined test scenario. For the evaluation of the ranking procedure a trajectory planner is developed and implemented. Due to the short computation times, the combination of the model predictive planner with a neural network is made possible. In this way, the field of behavior optimization by machine learning opens up, which does not offer a feasible implementation with other approaches of trajectory computation due to a particularly high number of time steps to be computed. In this way, an agent is implemented that performs the task of preventing another vehicle from overtaking and also enabling overtaking. The presented deterministic approach to the problem of performing aggressive overtaking maneuvers shows promising performance in the initial analysis. However, a high number of collisions still occur for the approach when driving on real track layouts.

English

Status:

Publisher's Version

URN:

urn:nbn:de:tuda-tuprints-204634

Classification DDC:

600 Technology, medicine, applied sciences > 620 Engineering and machine engineering

Divisions:

16 Department of Mechanical Engineering > Institute of Automotive Engineering (FZD)

Date Deposited:

01 Mar 2022 08:05

Last Modified: