TU Darmstadt / ULB / TUprints

Modelle und Methoden für die Kopplung automatischer und visuell-interaktiver Verfahren für die Datenanalyse

May, Thorsten (2012)
Modelle und Methoden für die Kopplung automatischer und visuell-interaktiver Verfahren für die Datenanalyse.
Technische Universität Darmstadt
Ph.D. Thesis, Primary publication

[img]
Preview
version (2012-06-01) - PDF
Dissertation(Thorsten_May)_web.pdf
Copyright Information: CC BY-NC-ND 2.5 Generic - Creative Commons, Attribution, NonCommercial, NoDerivs .

Download (22MB) | Preview
Item Type: Ph.D. Thesis
Type of entry: Primary publication
Title: Modelle und Methoden für die Kopplung automatischer und visuell-interaktiver Verfahren für die Datenanalyse
Language: German
Referees: Fellner, Prof.Dr. Dieter W. ; Hauser, Prof.Dr. Helwig
Date: 1 June 2012
Place of Publication: Darmstadt
Date of oral examination: 4 November 2011
Abstract:

Zusammenfassung In dieser Arbeit werden neue Kopplungsvarianten von Visualisierungstechniken und Data-Mining- Verfahren für die Datenanalyse vorgestellt. Die betrachteten Teilschritte der Analyse sind hierbei die Suche von Mustern, deren Transformation in formale Modelle und die Überprüfung dieser Modelle. Die Suche nach Mustern und deren Modellierung ist in diesen Technologien bisher nicht getrennt. In diesem Konzept werden die Aufgaben neu aufgeteilt: Die Suche und Identifizierung von Mustern übernimmt der Mensch mit Hilfe von interaktiven Visualisierungstechniken. Die Transformation der gefundenen Muster wird durch Data-Mining Verfahren übernommen. Diese Aufteilung nutzt die spezifischen Stärken von Mensch und Maschine besser. Der Mensch trägt mit seinem flexiblen und robusten Wahrnehmungssystem zu dieser Aufgabe bei; er wird gleichzeitig von der kognitiv anspruchsvolleren Aufgabe der Transformation der Muster entlastet. Die Maschine kann auch insbesondere komplexe Muster leichter in formale Modelle umformen. Wenn der Mensch die Interpretation ohne Hilfmittel oder Übung durchführen muß, können selten mehr als zwei bis dreidimensionale Muster interpretiert werden. In der Arbeit wird gezeigt, dass die Muster zehn- und mehrdimensionaler Zusammenhänge nicht nur dargestellt und wahrgenommen, sondern auch genutzt werden können. Durch die Aufteilung kann auch jene Schwäche automatischer Verfahren kompensiert werden, dass sie nur solche Muster finden, für deren Suche sie entwickelt wurden. Bei der Konstruktion der Modelle eliminiert die interaktive Vorgabe Mehrdeutigkeiten in den Mustern. Zur Überprüfung des konstruierten Modells wird daraus wieder ein Muster generiert, das mit den Mustern der Originaldaten visuell verglichen wird. Dies liefert qualitative Information über die Art des Modellierungsfehlers und die prinzipielle Eignung des automatischen Verfahrens, die quantitative Gütemaße allein nicht bereitstellen können. Zusammengenommen beschreibt das Konzept zwei Verbindungen zwischen visuell-interaktiven Techniken und automatischen Techniken in entgegengesetzte, sich ergänzende Richtungen. Mustererkennung, Interaktion und automatische Modellierung beschreiben den Weg von Muster zum Modell. Simulation, Feedback und visueller Abgleich beschreiben den Weg vom Modell zurück zum Muster. Das Modell der Daten wird in einem zyklischen, iterativen Prozess konstruiert, stetig überprüft und verfeinert. Um diese beiden Varianten der Kopplung von anderen, existierenden Verfahren abgrenzen zu können, wurde das allgemeine Modell des Visual-Analytics-Prozess verfeinert. Unabhängig von spezifischen Techniken wurden acht verschiedene Kopplungsvarianten identifiziert. Dabei werden sowohl bekannte Ansätze in die Systematik eingeordnet, als auch solche, die bisher nicht oder kaum in der Literatur umgesetzt werden.

Alternative Abstract:
Alternative AbstractLanguage

In this thesis new variants for the coupling of visualization techniques and data-mining methods are presented. The part of the analysis focused on is the search for patterns and their transformation in formal models. Prior to this work the search for patterns and their modelling has not been separated. In the concept of this thesis these two tasks are shared by human and machine. The search for patterns is done by the human with the aid of interactive visualization techniques. The transformation of the patterns into models is done with automated data-mining techniques. This separation of tasks makes better use of the specific strengths of humans and machines. The user makes use of her flexible and robust perception; at the same time she is relieved from the complex task of interpreting the visualization. The machine is better at transforming complex patterns into readable, formal models. If humans have to interpret patterns, one can not expect to find relationships spanning more than four or five dimensions of a dataset. This thesis shows that it is possible to visualize, perceive and finally use patterns of ten- and higher-dimensional data. By this separation a weakness of automated methods can be mitigated. Automated methods will only find patterns, for which they have been developed. Ambigious cases and signal to noise separation can be done more easily, if these methods are given the relevant patterns from the user input. For the model verification, a new pattern is generated from the predictive model. By visual comparison of the original and modeled data, it is possible to get information about the model quality, but also about the suitable of the automated method itself. In summary, the concept describes a connection between visual-interactive techniques and automated techniques in two complementing directions of analysis. Interaction and automated modeling describe the process of turning patterns into models. Feedback and visual comparison define the way back from the model to the pattern. The analytical model is created and constantly refined in a cyclic, iterative process. In addition to these two variants of coupling, we refine the generic model of the Visual Analytice Process. Independently of actual techniques we identified eight different ways to connected interactive and automated techniques. In this thesis, we classify existing approached according to this system, pointing to gaps in current Visual Analytics literature. January 2011 Thorsten May

English
Alternative keywords:
Alternative keywordsLanguage
Visual Analytics Visual Data Mining Information Visualization High-Dimensional Visualization Human-Computer InteractionEnglish
URN: urn:nbn:de:tuda-tuprints-29672
Classification DDC: 000 Generalities, computers, information > 004 Computer science
Divisions: 20 Department of Computer Science > Interactive Graphics Systems
Date Deposited: 04 Jun 2012 09:00
Last Modified: 09 Jul 2020 00:03
URI: https://tuprints.ulb.tu-darmstadt.de/id/eprint/2967
PPN: 386255687
Export:
Actions (login required)
View Item View Item