TU Darmstadt / ULB / TUprints

Computer Vision for Distant Vehicle Detection: How to Find Region Proposals for Low-Resolution Objects?

Fattal, Ann-Katrin (2020):
Computer Vision for Distant Vehicle Detection: How to Find Region Proposals for Low-Resolution Objects?
Darmstadt, Technische Universität, DOI: 10.25534/tuprints-00011310,
[Ph.D. Thesis]

[img]
Preview
Text
2019-10-30_Fattal_AnnKatrin.pdf
Available under CC-BY-NC-ND 4.0 International - Creative Commons, Attribution Non-commerical, No-derivatives.

Download (17MB) | Preview
Item Type: Ph.D. Thesis
Title: Computer Vision for Distant Vehicle Detection: How to Find Region Proposals for Low-Resolution Objects?
Language: English
Abstract:

Safety is crucial to the development and acceptance of assisted and highly automated driving functions. In 2017, 69.3% of German fatal accidents happened on roads where the speed limit was not enforced or higher than 100km/h. At this speed, to perform safe driving maneuvers, the environment perception is a key element. Detecting objects in distances up to 200m is instrumental in anticipating potential obstacles. Due to hardware limitations, an automotive camera maps cars in e.g. 200m distance to an image of only 8px width. Hence, the absence of local details degrades the state-of-the-art detection methods designed for detecting bigger sized objects. The scope of this thesis is to develop, extend and evaluate object region localizers to improve the detection range of cameras. A saliency inspired voting map is proposed that highlights anomalies in automotive scenes. The environment is modeled with few homogeneous regions representing the background within the image. Such global features allow detecting small object regions. Inspired by the concept of learning features, this thesis presents machine learning methods detecting small objects. Existing labeled data sets such as the KITTI data set only have object regions which sizes are larger than 25px height. The presented methods in this thesis are performed against a newly created data set with 67% of object regions having a width of 8-30px, a range that has rarely been subject to research yet. Convolutional Neural Network based localizers have been evaluated and extended. To maintain a low computational power, only small networks can be used. However, such networks are limited to the usage of local features. An incorporation of global generic priors to local networks is proposed, which increases the recall especially for small object regions. The parameters to adjust Region Proposal Networks (RPNs) for the special case of small objects are further optimized and the main parameters are identified. A novel relevance based net-surgery is introduced, allowing to select the most relevant features while maintaining the recall of the RPN. It is then possible to reduce the network size to these few features.

Alternative Abstract:
Alternative AbstractLanguage
Sicherheit ist ein wichtiger Aspekt in der Entwicklung und Akzeptanz von assistierten und hoch automatisierten Fahrfunktionen. Im Jahr 2017 geschahen 69.3% aller tödlichen Unfälle in Deutschland auf Landstraßen oder Autobahnen mit hohen Geschwindigkeiten über 100Km/h. Bei solchen Geschwindigkeiten ist eine robuste Umfelderfassung zu sicheren Fahrmanövern notwendig. Um in solchen Situationen sicher zu fahren, muss eine robuste Objekt Detektion bis 200m Entfernung gewährleistet sein. Aufgrund von limitierter Hardware kann eine automotive Kamera ein Auto in z.B. 200m Entfernung nur auf ca. 8 px abbilden. Dadurch sind lokale Details nicht abgebildet und aktuelle Objekt Detektionen verlieren stark an Performanz, da sie für größere Objekte ausgelegt sind. In dieser Thesis werden Methoden zur Objektregionen Lokalisierung in Bildern entwickelt, erweitert und ausgewertet um die Detektionsrate in der Entfernung zu erhöhen. Dazu wird ein von Aufmerksamkeitskarten inspirierter Ansatz entwickelt, der Besonderheiten in automotiven Szenen hervorhebt. Der Hintergrund im Bild wird dabei durch wenige homogene Bereiche modelliert. Solche globalen Ansätze erlauben die Detektion für kleine Objekte. Aktuelle Datensätze, wie bspw. der KITTI Datensatz, beinhalten minimal Objekte der Höhe 25px. Zur Evaluation der hier entwickelten Methoden wurde ein anspruchsvoller Datensatz generiert, in dem 67% der Objekte 8-30px breit sind. Dies zeigt, dass dieser Bereich von kleinen Objekten noch nicht Gegenstand aktueller Forschung ist. Faltende Netzwerke, welche die Merkmal Extraktion durch Parameteroptimierung lernen, eignen sich ebenfalls zur Lokalisierung von Objektregionen in Bildern (RPNs). Um jedoch den Rechenaufwand für automotive Anwendungen gering zu halten, eigenen sich vergleichbar kleine und dadurch lokal beschränkte Netzwerke. Daher wird die Einarbeitung von ausgewählten globalen Priors vorgeschlagen und Untersuchungen zeigen eine Verbesserung des Recalls für RPNs. In einer Parameteranalyse für faltende Lokalisierungsmethoden wird der Recall weiter optimiert und die wichtigsten Parameter identifiziert. Zur weiteren Optimierung von Merkmalen innerhalb des Netzwerks, wird eine neuartige Relevanz basierte Netzwerk-Operations-Methode entwickelt, die es ermöglicht, die markantesten Merkmale des Netzwerks zu identifizieren und das Netzwerk auf diese Merkmale zu verkleinern bei nahezu gleichbleibendem Recall.German
Place of Publication: Darmstadt
Classification DDC: 000 Allgemeines, Informatik, Informationswissenschaft > 000 Allgemeines, Wissenschaft
600 Technik, Medizin, angewandte Wissenschaften > 620 Ingenieurwissenschaften
Divisions: 18 Department of Electrical Engineering and Information Technology > Institut für Automatisierungstechnik und Mechatronik > Control Methods and Robotics
Date Deposited: 21 Jan 2020 14:11
Last Modified: 09 Jul 2020 06:23
DOI: 10.25534/tuprints-00011310
URN: urn:nbn:de:tuda-tuprints-113100
Referees: Adamy, Prof. Dr. Jürgen and Hohmann, Prof. Dr. Sören
Refereed: 30 October 2019
URI: https://tuprints.ulb.tu-darmstadt.de/id/eprint/11310
Export:
Actions (login required)
View Item View Item