Sensorik, Robotik und verbesserte Messverfahren führen zu einer Schwemme an Beobachtungsdaten, deren
manuelle Auswertung den Benutzer überfordert. Die computergestützte Auswertung ermöglicht einen effektiveren
Umgang mit diesen Datenmengen. Dabei können zwei Analyseziele unterschieden werden. In einigen
Szenarien existieren klar definierte Muster die gefunden, oder Hypothesen, die überprüft werden sollen. Hier
erzielen komplett automatisierte Ansätze sehr gute Resultate, da sie wesentlich effizienter als der Mensch eindeutig
beschriebene Muster in großen Datenmengen finden können. Im Gegensatz dazu steht die explorative
Datananalyse mit der ich mich in dieser Arbeit beschäftige.
Die Idee einer engen Kombination von automatischen Analysealgorithmen, interaktiver Visualisierung und
Integration von Expertenwissen dient als Basis für die beiden folgenden Teile meiner Arbeit, den visuell-interaktiven
Vergleich von Deskriptoren und die visuelle Analyse von zeitabhängigen Daten.
Um große Datenmengen aus komplexen Objekten wie Netzwerken oder Molekülen computergestützt verarbeiten
zu können, wird für diese eine kompakte Repräsentationsform benötigt. Diese sollte für die Analyse relevante
Information enthalten. Solche Beschreibungen können sowohl einfache numerische Werte sein, wie etwa die
Ladung eines Moleküls, aber auch lange Ketten von Zeichen, die zum Beispiel die DNA Struktur eines Bakteriums
repräsentieren. Jede dieser Beschreibungen stellt einen Deskriptor dar, die ihrerseits beliebig zu sogenannten
Deskriptorräumen kombiniert werden können. Durch die explorative Analyse und den Vergleich verschiedener
Repräsentationen der Daten können Muster und Zusammenhänge sichtbar werden bzw. deren Bewertung erleichtert
werden. Ziel der Analyse ist es Ähnlichkeiten und Unterschiede zwischen verschiedenen Deskriptoren
sowohl auf globaler als auch lokaler Ebene zu finden. Das gilt sowohl im paarweisen Vergleich als auch im Vergleich
aller verfügbarer Deskriptoren. Tritt ein Muster etwa in verschiedenen Deskriptoren der gleichen Daten
auf, ist es potentiell interessanter und verlässlicher als bei nur seltenem Auftreten. Ich stelle in dieser Arbeit Ansätze
für den Vergleich von Daten vor, deren Struktur hierarchisch oder nicht bekannt ist. In beiden Fällen folge
ich dem in der Visual Analytics typischen Ansatz und verbinde eine automatische Analyse, zum Beispiel die
algorithmische Bewertung von Ähnlichkeit, mit einer interaktiven Visualisierung um das Wissen des Benutzers
in die explorative Anaylse zu integrieren.
Zeitabhängige Daten treten in vielen Anwendungsgebieten wie der Finanazanalyse, der Klimabeobachtung oder
der Medizin auf. Die zeitliche Komponente spielt dabei eine entscheidende Rolle, die sowohl bei der automatischen
Analyse als auch bei der Visualisierung berücksichtigt werden muss. Viele Methoden ähneln stark denen
aus anderen Spezialisierungsfeldern innerhalb der Visual Analytics, sind aber auf die spezifischen Anforderungen
zeitabhängiger Daten angepasst. Diese Arbeit enthält Beiträge zu zwei Teilbereichen, der Analyse gruppierter
zeitabhängiger Daten und der Analyse sequenzieller zeitabhängiger Daten. | German |