Abstract: |
Zusammenfassung
In dieser Arbeit werden neue Kopplungsvarianten von Visualisierungstechniken und Data-Mining-
Verfahren für die Datenanalyse vorgestellt. Die betrachteten Teilschritte der Analyse sind hierbei
die Suche von Mustern, deren Transformation in formale Modelle und die Überprüfung dieser
Modelle. Die Suche nach Mustern und deren Modellierung ist in diesen Technologien bisher nicht
getrennt. In diesem Konzept werden die Aufgaben neu aufgeteilt: Die Suche und Identifizierung von
Mustern übernimmt der Mensch mit Hilfe von interaktiven Visualisierungstechniken. Die Transformation
der gefundenen Muster wird durch Data-Mining Verfahren übernommen. Diese Aufteilung
nutzt die spezifischen Stärken von Mensch und Maschine besser.
Der Mensch trägt mit seinem flexiblen und robusten Wahrnehmungssystem zu dieser Aufgabe bei;
er wird gleichzeitig von der kognitiv anspruchsvolleren Aufgabe der Transformation der Muster
entlastet. Die Maschine kann auch insbesondere komplexe Muster leichter in formale Modelle umformen.
Wenn der Mensch die Interpretation ohne Hilfmittel oder Übung durchführen muß, können
selten mehr als zwei bis dreidimensionale Muster interpretiert werden. In der Arbeit wird gezeigt,
dass die Muster zehn- und mehrdimensionaler Zusammenhänge nicht nur dargestellt und wahrgenommen,
sondern auch genutzt werden können.
Durch die Aufteilung kann auch jene Schwäche automatischer Verfahren kompensiert werden, dass
sie nur solche Muster finden, für deren Suche sie entwickelt wurden. Bei der Konstruktion der Modelle
eliminiert die interaktive Vorgabe Mehrdeutigkeiten in den Mustern. Zur Überprüfung des
konstruierten Modells wird daraus wieder ein Muster generiert, das mit den Mustern der Originaldaten
visuell verglichen wird. Dies liefert qualitative Information über die Art des Modellierungsfehlers
und die prinzipielle Eignung des automatischen Verfahrens, die quantitative Gütemaße
allein nicht bereitstellen können.
Zusammengenommen beschreibt das Konzept zwei Verbindungen zwischen visuell-interaktiven Techniken
und automatischen Techniken in entgegengesetzte, sich ergänzende Richtungen. Mustererkennung,
Interaktion und automatische Modellierung beschreiben den Weg von Muster zum Modell.
Simulation, Feedback und visueller Abgleich beschreiben den Weg vom Modell zurück zum
Muster. Das Modell der Daten wird in einem zyklischen, iterativen Prozess konstruiert, stetig überprüft
und verfeinert.
Um diese beiden Varianten der Kopplung von anderen, existierenden Verfahren abgrenzen zu können,
wurde das allgemeine Modell des Visual-Analytics-Prozess verfeinert. Unabhängig von spezifischen
Techniken wurden acht verschiedene Kopplungsvarianten identifiziert. Dabei werden sowohl
bekannte Ansätze in die Systematik eingeordnet, als auch solche, die bisher nicht oder kaum
in der Literatur umgesetzt werden. |
Alternative Abstract: |
Alternative Abstract | Language |
---|
In this thesis new variants for the coupling of visualization techniques and data-mining methods are presented. The part of the analysis focused on is the search for patterns and their transformation in formal models. Prior to this work the search for patterns and their modelling has not been separated. In the concept of this thesis these two tasks are shared by human and machine. The search for patterns is done by the human with the aid of interactive visualization techniques. The transformation of the patterns into models is done with automated data-mining techniques. This separation of tasks makes better use of the specific strengths of humans and machines.
The user makes use of her flexible and robust perception; at the same time she is relieved from the complex task of interpreting the visualization. The machine is better at transforming complex patterns into readable, formal models. If humans have to interpret patterns, one can not expect to find relationships spanning more than four or five dimensions of a dataset. This thesis shows that it is possible to visualize, perceive and finally use patterns of ten- and higher-dimensional data.
By this separation a weakness of automated methods can be mitigated. Automated methods will only find patterns, for which they have been developed. Ambigious cases and signal to noise separation can be done more easily, if these methods are given the relevant patterns from the user input. For the model verification, a new pattern is generated from the predictive model. By visual comparison of the original and modeled data, it is possible to get information about the model quality, but also about the suitable of the automated method itself.
In summary, the concept describes a connection between visual-interactive techniques and automated techniques in two complementing directions of analysis. Interaction and automated modeling describe the process of turning patterns into models. Feedback and visual comparison define the way back from the model to the pattern. The analytical model is created and constantly refined in a cyclic, iterative process.
In addition to these two variants of coupling, we refine the generic model of the Visual Analytice Process. Independently of actual techniques we identified eight different ways to connected interactive and automated techniques. In this thesis, we classify existing approached according to this system, pointing to gaps in current Visual Analytics literature.
January 2011 Thorsten May | English |
|