TU Darmstadt / ULB / TUprints

Ein Verfahren zur Anreicherung fachgebietsspezifischer Ontologien durch Begriffsvorschläge

Faatz, Andreas (2004)
Ein Verfahren zur Anreicherung fachgebietsspezifischer Ontologien durch Begriffsvorschläge.
Technische Universität Darmstadt
Ph.D. Thesis, Primary publication

[img]
Preview
PDF
diss_deutsch.pdf
Copyright Information: In Copyright.

Download (974kB) | Preview
Item Type: Ph.D. Thesis
Type of entry: Primary publication
Title: Ein Verfahren zur Anreicherung fachgebietsspezifischer Ontologien durch Begriffsvorschläge
Language: German
Referees: Steinmetz, Prof. Dr.- Ralf ; Fürnkranz, Prof. Dr. Johannes
Advisors: Steinmetz, Prof. Dr.- Ralf
Date: 10 December 2004
Place of Publication: Darmstadt
Date of oral examination: 25 November 2004
Abstract:

Ontologien bestehen aus Fachbegriffen eines Wissensgebietes, die in Form von Ober- und Unterbegriffen gegliedert und durch weitere semantische fachgebietsspezifische Relationen verbunden sind. Die Dissertationsschrift stellt einen neuartigen Ansatz dar, eine automatische Unterstützung des Ontologieerstellungsprozesses zu liefern. Das Verfahren kann bestehende Ontologien erweitern und so einen Beitrag zur erleichterten Konstruktion und Wiederverwendung bestehender Wissensrepräsentationen liefern. Es wurde dazu eine ähnlichkeitsbasierte Methode definiert und erprobt. Die Wirkungsweise der Methode gleicht die Ähnlichkeiten zwischen Begriffspaaren aus der Ontologie und die Ähnlichkeiten, die sich aus der Verwendung von Fachbegriffen in einem Textkorpus bestimmen lassen, einander an. Die in der Arbeit dargelegten Messergebnisse zeigen, dass für ein beispielhaftes Szenario eine Definition des Verfahrens gefunden werden kann, die anderen Verfahren signifikant überlegen ist: die Kombination aus dem neu definierten vektorwertigen Ähnlichkeitsmaß, das auf dem Jaccardmaß beruht, und dem ontologischen Vegleichsmaß nach Resnik. Die Bewertung des Verfahrens im Beispielszenario beruht auf einem Datenbestand, wie er in einer realistischen Projektsituation (k-med) entsteht. Die in der Arbeit definierte Vorgehensweise der Messungen ist auf weitere konkrete Anwendungsfälle, in denen Ontologieanreicherungen vorgenommen werden sollen, übertragbar. Alle in dieser Arbeit neu definierten Kriterien der Bewertung, nämlich Fehlklassifikation, Anreicherungsneigung und Recalleigenschaften, stehen in unmittelbarem Zusammenhang mit verschiedenen Phasen des kooperativen Ontologieerstellungsprozesses nach Holsapple und Joshi, dessen iterative Phasen im Rahmen dieser Arbeit mit der Erstellung von Metadaten und noch allgemeiner mit der Verschlagwortung von Dokumenten integriert wurden. Das ähnlichkeitsbasierte Verfahren eröffnet in zweifacher Hinsicht Möglichkeiten der automatischen Unterstützung. Sind eine Ontologie und ein Textkorpus gegeben, so kann der Moderator des Ontologieerstellungsprozesses jedem Ersteller der Ontologie unabhängig von der Anwendung der Ontologie Begriffsvorschläge und ihren Bezug zur bereits vorhandenen Ontologie zukommen lassen. Dies kann im Erstellungsprozess bereits sehr früh und sehr spezifisch, das heißt mit kleinen fachbezogenen Ontologien, geschehen. Die vorliegende Arbeit geht in diesem Sinne über vorhandene Arbeiten der vollständig automatischen Generierung von Ontologien hinaus.

Alternative Abstract:
Alternative AbstractLanguage

Ontologies are constructed from domain specific concepts by subconcept relations and further domain specific relations. This structure offers a semantic richness, which can be applied for a new generation of search, navigation and service facilities. The PhD thesis explores and proves a novel approach - so-called ontology enrichment - for an automated support of the ontology construction process. The approach is able to extend given ontologies and contributes to reuseability and rapid development of ontologies. In this PhD thesis, a consequent focus on the enrichment of existing ontologies improves the state of the art approaches, which tend to ignore existing manually built structures. The author of the PhD thesis developed and tested a similarity based method. It is based on fitting similarity values, which originate from the structure of a given ontology, to the similarity values, which are derived from collocation vectors in a given domain specific text corpus. Measurements show, that for a particular new combination of similarity heuristics (Jaccard measure and Resnik's measure) the approach succeeds in re-constructing a given ontology. The evaluation of the ontology enrichment approach was based on a realistic data set from the e-Learning project k-med ("knowledge based multimedia medical education"). Ontology enrichment can also be applied to other domains. The PhD thesis proposes the steps in need for such an application. All steps are embedded in a collaborative ontology construction approach due to Holsapple and Joshi. Especially for ontology applications, which refer to the ontology as a vocabulary of document keywords, the PhD thesis shows, how the automatic support by ontology enrichment and the application of the ontology positively interact.

English
Uncontrolled Keywords: maschinelles Lernen, Ontologien
Alternative keywords:
Alternative keywordsLanguage
maschinelles Lernen, OntologienGerman
machine learning, ontologiesEnglish
URN: urn:nbn:de:tuda-tuprints-5054
Classification DDC: 000 Generalities, computers, information > 004 Computer science
Divisions: 20 Department of Computer Science
Date Deposited: 17 Oct 2008 09:21
Last Modified: 07 Dec 2012 11:50
URI: https://tuprints.ulb.tu-darmstadt.de/id/eprint/505
PPN:
Export:
Actions (login required)
View Item View Item