TUD Technische Universität Darmstadt
Universitäts- und Landesbibliothek
ULB Darmstadt

EPDA - Elektronische Publikationen Darmstadt


Autor: Volmer, Stephan
Titel:Inhaltsbasierte Bildsuche mittels visueller Merkmale
Dissertation:TU Darmstadt, Fachbereich Informatik, 2006

Die Dokumente in PDF 1.3 (mit Adobe Acrobat Reader 4.0 zu lesen):

volmer-dissertation.pdf (4877532 Byte)

Abstract auf Deutsch:


Die ständig wachsende Menge an verfügbaren digitalen Daten erfordert neuartige Methoden, die einen gezielten Zugriff auf relevante Information ermöglichen. Eine zentrale Rolle spielt in diesem Zusammenhang die automatische Erschließung bildlicher Information in digitalen Bilddaten. Der klassische Ansatz - die manuelle Annotation des Bildinhaltes mittels alphanumerischer Texte - hat sich in der Vergangenheit als zu fehleranfällig und zu kostenintensiv erwiesen. Im Rahmen dieser Arbeit wird ein alternativer Ansatz entwickelt, der es ermöglicht, große Mengen von digitalen Bilddaten mittels merkmalsbasierter Verfahren zu erschließen. Dies geschieht unter der Annahme, dass das zugrundeliegende Bildmaterial weder aufgrund seines Erscheinungsbildes, noch aufgrund seiner Bedeutung irgendeiner Einschränkung unterliegt. Zunächst wird ein allgemeingültiges Modell für die merkmalsbasierte Suche nach visuellen Inhalten in digitalen Bildern definiert. Dieses Modell stellt den formalen Rahmen für die Entwicklung und Kombinierung neuartiger Algorithmen zur Merkmalsextraktion und -indexierung dar. Das Modell ermöglicht eine inhaltsbasierte Bildsuche auf der Basis eines Systems mit einheitlicher Architektur und standardisierten Schnittstellen. Ein solches System kann durch die Entwicklung einzelner anwendungsspezifischer Bausteine für eine bestimmte Problemstellung erweitert werden. Startpunkt für die Entwicklung eines Algorithmus zur Merkmalsextraktion ist die sinnvolle Interpretation der Farben einzelner diskreter Bildpunkte. Der Mensch unterscheidet im Gegensatz zur technischen Darstellung nur zwischen einer handvoll verschiedener Farben. Daher wird im Rahmen dieser Arbeit die neuartige Farbrepräsentation vorgestellt, die die Farbinformation eines Bildes auf der Basis von - für den Menschen bedeutungsvollen - Farbnamen zugänglich macht. Das zugrundeliegende mathematische Gerüst ermöglicht einen einfachen und schnellen Vergleich von Farben. Eine solche Interpretation von Farbinformation kann nahezu für jede Aufgabe im Bereich der digitalen Bildverarbeitung nutzbringend eingesetzt werden. Auf dieser Farbrepräsentation aufbauend werden einige universelle Extraktionsalgorithmen vorgestellt, die gewisse visuelle Aspekte eines digitalen Bildes kompakt beschreiben. Große Datenmengen bedingen entsprechend lange Verarbeitungszeiten bei der Suche nach Information. Daher wird im letzten Teil der Arbeit ein Indexierungsverfahren vorgestellt, dass die proportionale Beziehung zwischen Datenmenge und Verarbeitungszeit aufbricht. Das Indexierungsverfahren basiert auf der Lokaliserung der Suche in der unmittelbaren Umgebung der Suchanfrage im Merkmalsraum. Durch das Eingrenzen des Suchraums kann eine signifikante Beschleunigung der Suche erreicht werden. Da ein solches Verfahren immanent mit einer gewissen Ungenauigkeit behaftet ist, werden experimentelle Ergebnisse präsentiert, die den Nutzen des Verfahrens im praktischen Einsatz dokumentieren.


Abstract auf Englisch:

The constantly growing quantity of available digital data requires novel methods in order to enable direct access to relevant information. The automatic extraction of pictorial information from digital images plays a central role in this context. The traditional approach - the manual annotation of the images' content by means of alphanumeric text - has proven in the past as too error-prone and too cost-intensive. In the scope of this work an alternative approach that enables the handling of large quantities of digital image data by means of feature-based algorithms is pursuit. It is assumed that the images are not constrained by their visual appearance or their semantic content. For this purpose a generic model for feature-based image retrieval is defined. The model constitutes a formal framework for the development and combination of new algorithms for feature extraction and similarity indexing. It enables content-based retrieval systems to be built on basis of a uniform software architecture with standardized interfaces. Such a system can be easily extended by individually developed components with regard to customer-specific problems. Human visual recognition and recall are highly dependent on color as a visual cue. A key step of the feature extraction process is the meaningful interpretation of individual pixel colors. Contrary to the potential of technical representations, humans can only differentiate between a few different colors. Therefore, a novel color model is introduced that makes color information accessible by means of - for humans meaningful - color names. Its underlying mathematical foundation enables a simple and fast comparison of colors. Such a representation of color can be leveraged profitably for almost any task in the domain of Digital Image Processing. Some feature extraction algorithms based on this color model that describe certain visual aspects of a digital image are presented exemplarily. Large amounts of data inherently require longer processing times when performing search tasks. Consequently, a similarity indexing scheme is presented that breaks the proportional relationship between the amount of data searched and the time needed to perform the search. The indexing scheme is based on the principle of localization of the search in feature space. A significant acceleration can be achieved by reducing the search space to the immediate neighborhood of the query. Since such an approach is immanently afflicted with a certain imprecision, experimental results are presented that document its usefulness in a realistic scenario.

Dokument aufgenommen :2006-11-23
URL:http://elib.tu-darmstadt.de/diss/000750