Intelligent Computer-assisted Process Mining

Seeliger, Alexander (2020)
Intelligent Computer-assisted Process Mining.
Technische Universität Darmstadt
doi: 10.25534/tuprints-00011915
Ph.D. Thesis, Primary publication

Preview

Text
Diss_AlexanderSeeliger_20200728.pdf
Copyright Information: CC BY-NC-ND 4.0 International - Creative Commons, Attribution NonCommercial, NoDerivs.
Download (9MB) | Preview

Item Type:

Ph.D. Thesis

Type of entry:

Primary publication

Title:

Intelligent Computer-assisted Process Mining

Language:

English

Referees:

Mühlhäuser, Prof. Dr. Max ; Rosemann, Prof. Dr. Michael

Date:

2020

Place of Publication:

Darmstadt

Date of oral examination:

26 June 2020

DOI:

10.25534/tuprints-00011915

Abstract:

Most enterprises and organizations have digitized their work by implementing process-aware information systems. These systems typically record a large amount of event data about the organization's day-to-day business. Organizations are interested in analyzing this data to optimize their business processes. Process mining is a research field that analyzes event data to obtain valuable knowledge about how processes are executed in reality. Different from conventional interview-based methods, process mining analyzes the process performance and compliance solely based on recorded event data.

Currently, the work of analysts using process mining tools is characterized as largely manual, leading to many ad-hoc tasks. With the growth of available event data and the increasing complexity of processes, several issues emerge in practice. Many process mining methods are not specifically designed for large event logs, leading to high computation time and a substantial amount of manual work. Consequently, suitable subsets of cases must be selected before applying certain analysis tasks successfully. Furthermore, applying process mining techniques to unknown event data often requires extensive domain knowledge and process mining expertise to obtain valuable insights. Although efforts were made to systematize the manual work of analysts in process mining projects, current tools lack intelligent computer-assisted guidance.

This dissertation introduces several contributions to different steps along an analyst's workflow to address the above issues. It is divided into three major parts: The first part introduces a process knowledge artifact framework that simplifies data extraction and processing of heterogeneous data sources as an enabling preparatory step towards process mining. In the second part, the dissertation introduces three algorithms specifically designed for large and complex real-life event logs. A novel compliance checking algorithm significantly improves runtime performance for large event logs to identify compliance rule violations. A parameter-free process drift detection algorithm automatically detects changes in the process execution over time to reveal potential process issues. A novel multi-perspective trace clustering algorithm automatically detects patterns in the control flow and the data perspective of a process to reveal the different process behaviors in event logs, aiming at simplifying process discovery. The third part of the dissertation integrates the contributions made in the first two parts and introduces an interactive visual recommendation approach to enhance process analysis guidance. Lastly, a process improvement approach is presented, suggesting modifications to process models for a given improvement goal.

The proposed algorithms and methods were evaluated with synthetic and real-life event logs, demonstrating their superior qualitative performance and practical feasibility. A user study conducted with process mining experts evaluated the prototype implementation of the interactive visual recommendation system to assess the usefulness in the process analysis workflow.

Alternative Abstract:

Alternative Abstract

Language

Viele Unternehmen haben ihre Arbeitsabläufe mittels prozessorientierter Informationssysteme digitalisiert. Diese Informationssysteme sammeln eine große Menge an Ereignisdaten über das Tagesgeschäft von Unternehmen. Durch die Analyse dieser Daten erhoffen sich Unternehmen ihre Geschäftsprozesse zu optimieren. Process Mining ist ein Forschungsgebiet, das solche Ereignisdaten analysiert, um wertvolle Erkenntnisse über den tatsächlichen Ablauf von Prozessen zu gewinnen. Im Gegensatz zu Interview-basierten Methoden nutzt Process Mining ausschließlich aufgezeichnete Ereignisdaten, um Prozessperformance und Konformitätsverstöße zu ermitteln.

Die Analyse von Geschäftsprozessen mittels aktueller Process-Mining-Werkzeuge ist jedoch zum größten Teil durch viele manuelle Arbeitsschritte charakterisiert. Das stetige Wachstum an verfügbaren Daten sowie die zunehmende Komplexität von Geschäftsprozessen führen in der Praxis daher zu erheblichen Problemen bei der Analyse. Viele Process-Mining-Methoden wurden nicht speziell für große Ereignisprotokolle optimiert, was oft zu langen Berechnungszeiten führt. Daher müssen oft sinnvolle Teilmengen selektiert werden, um die Analyse erfolgreich ausführen zu können. Zudem erfordern viele Process-Mining-Methoden umfangreiches prozessspezifisches Fachwissen sowie Process-Mining-Knowhow, um wertvolle Erkenntnisse zu gewinnen. Trotz der Systematisierung von Process-Mining-Aufgaben fehlen derzeitigen Werkzeugen intelligente computergestützte Analyseempfehlungen.

Diese Arbeit stellt mehrere Beiträge entlang der Vorgehensweise von Analysten im Process Mining vor, um die beschriebenen Problemfelder zu adressieren. Die Arbeit ist in drei Hauptteile gegliedert: Im ersten Teil wird ein Rahmenwerk vorgestellt, welches die Datenextraktion und -verarbeitung von Prozessdaten aus heterogenen Datenquellen vereinfacht, um Process Mining anwenden zu können. Der zweite Teil stellt drei Algorithmen vor, die speziell für die Verarbeitung von großen und komplexen Ereignisprotokollen entwickelt wurden. Ein neuartiger Compliance-Checking-Algorithmus erkennt Konformitätsverstöße auch in sehr umfangreichen Ereignisprotokollen und zeichnet sich dabei durch deutlich verbesserte Laufzeit aus. Ein parameter-freier Process-Drift-Detection-Algorithmus detektiert automatisiert Veränderungen des Prozessverhaltens über die Zeit in Ereignisprotokollen, die zu potenziellen Prozessproblemen führen können. Ein neuartiger Multi-Perspective-Trace-Clustering-Algorithmus extrahiert verschiedene Prozessverhalten in Ereignisprotokollen auf Basis von Kontrollfluss und Datenattributen automatisch, um Process Discovery zu verbessern. Der dritte Teil der Arbeit integriert die ersten beiden Teile und stellt ein interaktives Analyseempfehlungssystem vor, das Analysten konkrete Analysevorschläge erzeugt. Schließlich wird ein Ansatz vorgestellt, der auf Basis zuvor definierter Ziele Verbesserungen an Prozessmodellen vorschlägt.

Die vorgestellten Algorithmen und Methoden wurden mittels synthetischer und realer Ereignisprotokollen ausgewertet, um deren qualitative Leistung und deren praktischen Nutzen zu demonstrieren. Mittels einer durchgeführten Nutzerstudie mit Process Mining Experten wurde das interaktive Analyseempfehlungssystem ausgewertet, um dessen Nützlichkeit im Rahmen von Process Mining Projekten zu bewerten.

German

URN:

urn:nbn:de:tuda-tuprints-119154

Classification DDC:

000 Generalities, computers, information > 004 Computer science

Divisions:

20 Department of Computer Science > Telecooperation

Date Deposited:

18 Aug 2020 12:06

Last Modified:

18 Aug 2020 14:05

URI: