Die Problemstellung, die in dieser Dissertation adressiert wird, kann wie folgt beschrieben werden: eine Beschreibung eines Geschäftsvorgangs, die in einer Web Service Infrastruktur in Form einer Abfrage vorgegeben ist, soll in einer großen Datenquelle effizient Geschäftsprozesse aufspüren, die komplementär zur Eingabe-Abfrage sind. Insbesondere kann der Eingabe-Geschäftsprozess vorschreiben, dass einige Teile des Geschäftsvorgangs zwingend erforderlich sind. Zum Beispiel sucht ein Einkäufer, der eine bestimmte RosettaNet PIPs Beschreibung und das dazu gehörige Datenbeschreibungsverzeichnis einsetzt, einen Lieferanten, der ebenfalls demselben RosettaNet Standard folgt und somit auch den Geschäftsprozessen des Einkäufers entspricht. Nach Abschluss der Auftragsvergabe würde hier der Geschäftsvorgang zwingend beendet werden. Die derzeitigen, mit UDDI (Universal Description, Discovery and Integration) erstellten Webservice Technologien sowie verwandte Technologien sind nicht in der Lage dieses Problem zu lösen, da diese zur Dienstfindung nur begrenzte Unterstützung auf Attribute-/Werte-basierenden Abfragen anbieten können und demnach auf die atomare Dienstfindung beschränkt ist. In der Forschung werden BPEL4WS oder BPEL (Business Process Execution Language für Web Services) zur Beschreibung von Geschäftsprozessen verwendet. Es hat sich gezeigt, dass diesen Sprachen ein solides, formales Modell und daher auch eine formale Semantik fehlt, um Abfragen von Geschäftsvorgangsbeschreibungen durchzuführen. Dies bedeutet, dass ein formales Modell benötigt wird, um Geschäftsprozesse darstellen zu können und ihre Abfrage zu ermöglichen. Geeignete, auf einem solchen, formalen Modell aufbauende Techniken werden zur Indizierung benötigt, um Abfragen in großen Datenquellen effizient gestalten zu können. Ein Geschäftsprozess kann als eine Abfolge von Nachrichten beschrieben werden, wobei jede Nachricht eine mögliche Sequenz in der Ausführung eines Vorgangs repräsentiert. Anhand dieses Modells kann durch Abgleichen der Geschäftsprozesse in der Datenquelle nach passenden Prozessen abgefragt werden. Der Abgleichvorgang ist definiert durch die Berechnung einer gemeinsamen Menge an Sequenznachrichten, die die zwingend notwendigen Teile enthalten. Die Semantik des Algorithmus zum Abgleich von Geschäftsprozessen kann durch Modellieren der endlichen Zustandsautomaten (final state automata, FSA), d. h. durch Anreichern mit aussagenlogischen Ausdrücken, formalisiert werden. Diese angereicherten FSAs (aFSAs) können Sequenznachrichten (möglicherweise unendlich) in einem Geschäftsprozess ausdrücken, während logische Ausdrücke sowohl erforderliche als auch wahlfreie Teile des Geschäftsprozesses darstellen können. Der Abgleich von Geschäftsprozessen ist formal definiert als die nicht leere Schnittmenge von aFSAs, die die erforderlichen Teile einer Geschäftsprozessbeschreibung enthalten. Die Schnittmenge von aFSAs zu berechnen ist rechenintensiv und mehr als quadratisch zur Anzahl der Zustände und übergänge. Ferner skaliert ein sequentielles Scannen von großen Datenquellen nicht bei der Suche nach passenden Geschäftsprozessen, auch wenn die einzelnen Abfrageoperationen einfach aufgebaut sind. Herkömmlicherweise werden Indizes verwendet, um Anfragen in Datenbanken zu beschleunigen. Indizes zu schnittmengen-basierten Anfragen von aFSAs werden jedoch von Standard-Datenbank-Indexierungstechniken wie beispielsweise B+-tree nicht unterstützt. Eine Möglichkeit ist, einen Index auf Basis von aFSA Sequenznachrichten und Annotationen zu erzeugen, Hier werden Sequenznachrichten-äquivalenz und die Auswertung der Kommentierungen für die Erstellung der Schnittmengen mit berücksichtigt. Die Anzahl der Sequenznachrichten in einer aFSA kann unendlich sein, da sich Schleifen in der Spezifikation des Geschäftsprozesses bilden können. In dieser Dissertation wird ein formales Modell zur Indexierung und Abfrage von Geschäftsprozessen entwickelt. Der Ansatz zur Indexierung basiert auf Abstraktionen zur Transformation von aFSAs über die Grammatik in eine Struktur, die durch verfügbare Indexierungsmechanismen wie z. B. B+-tree indiziert werden kann . Die Indexierungslösung wird implementiert und ausgewertet. Die Evaluierungsergebnisse zeigen, dass die Indexierung das sequentielle Scannen um mehrere Größenordnungen übertrifft. Eine Analyse der Evaluierungsergebnisse zeigt darüber hinaus, dass der Index auch mit zunehmender Anzahl an Datensätzen gut skaliert und gute Recheneigenschaften bei der Suche aufweist, da die Suche sich linear zur Anzahl der aFSAs in der Datensammlung verhält. | German |