Unterstützung des Ressourcen-basierten Lernens in Online Communities - Automatische Erstellung von Großtaxonomien in verschiedenen Sprachen

Domínguez García, Renato (2012)
Unterstützung des Ressourcen-basierten Lernens in Online Communities - Automatische Erstellung von Großtaxonomien in verschiedenen Sprachen.
Technische Universität Darmstadt
Ph.D. Thesis, Primary publication

Preview

Text
ClassicThesis.pdf
Copyright Information: CC BY-NC-ND 2.5 Generic - Creative Commons, Attribution, NonCommercial, NoDerivs .
Download (3MB) | Preview

Item Type:

Ph.D. Thesis

Type of entry:

Primary publication

Title:

Unterstützung des Ressourcen-basierten Lernens in Online Communities - Automatische Erstellung von Großtaxonomien in verschiedenen Sprachen

Language:

German

Referees:

Steinmetz, Prof. Ralf ; Schroeder, Prof. Ulrik

Date:

2012

Place of Publication:

Darmstadt

Date of oral examination:

4 February 2012

Abstract:

Die sich stetig verändernden beruflichen Rahmenbedingungen und die immer kürzer werdende Gültigkeit einmal erworbenen Wissens verlangen flexible Formen des Wissens- und Kompetenzerwerbs. Das in Bildungseinrichtungen angeeignete Wissen reicht nicht mehr ein Leben lang. Vielmehr besteht insbesondere im Arbeitsprozess zunehmend die Notwendigkeit, sich abhängig von der konkreten Problemstellung situativ Wissen anzueignen. Man spricht von selbstgesteuertem Lernen, da Lernende für ihre Lern- bzw. Wissenserwerbsprozesse selbst verantwortlich sind. Gleichzeitig hat sich das World Wide Web zu einer der wichtigsten Quellen beim Wissenserwerb entwickelt. Das selbstgesteuerte Lernen mit Hilfe von Ressourcen aus dem Internet wird auch Ressourcen-basiertes Lernen bezeichnet.

Eine der größten Herausforderung im Ressourcen-basierten Lernen ist es, relevante Web-Ressourcen im Web zu finden. Suchmaschinen werden sehr häufig verwendet, liefern aber praktisch keine Hilfestellung bei der Auswahl und Beurteilung gefundener Ressourcen. Empfehlungssysteme (engl. Recommender Systems) können grundsätzlich hilfreich sein, um für die jeweilige Situation und den jeweiligen Lernenden relevanten Ressourcen zu finden. Lernende können davon profitieren, dass sie auf Wissensressourcen hingewiesen werden, die andere Lernende, die einen ähnlichen Wissensbedarf besitzen, verwendet haben. In größeren Gruppen oder in einer Community sind für die eigene Lernaufgabe relevante Ressourcen mit hoher Wahrscheinlichkeit bereits von anderen Personen gefunden worden.

Ziel dieser Arbeit war es, das Ressourcen-basierte Lernen innerhalb einer Community von Lernenden zu unterstützen, indem Lernende situationsbezogen auf Wissensressourcen hingewiesen werden, die andere Community-Mitglieder bereits verwendet haben.

Zur Erreichung dieses Ziels wurde das Anwendungsszenario am Beispiel der CROKODIL-Plattform, eine Plattform zur Unterstützung des Ressourcen-basierten Lernens, untersucht. Die Untersuchung ergab, dass Benutzer oftmals nicht auf interessante Ressourcen hingewiesen werden können, wenn sie unterschiedliche Terminologien bei der Verschlagwortung von beim Lernen genutzten Ressourcen verwenden. Basierend auf dieser Feststellung wurde ein Konzept entwickelt, welches die Lücken in den von den Benutzern verwendeten Terminologien mittels der Verwendung einer Taxonomie schließt. Die Analyse ergab weiterhin, dass das Anwendungsszenario dadurch gekennzeichnet ist, dass die Benutzer aktuelle Begriffe in mehreren Sprachen als Schlagworte verwenden. Taxonomien, die diese Schlagworte in Beziehung zueinander setzen wollen, müssen daher dadurch charakterisiert sein, dass sie sehr aktuell sind und im mehreren Sprachen vorliegen. Diese Anforderungen können von existierenden manuell erzeugten Taxonomien nicht erfüllt werden.

Daher wurden in der Arbeit mit TaxWikiHeur.KOM und TaxWikiML.KOM zwei Verfahren konzipiert und implementiert, die weitestgehend sprachunabhängig aus der Online Enzyklopädie Wikipedia Taxonomien generieren, indem sie Kategorienpaare aus der Wikipedia in Hyponymie- und Nicht-Hyponymiebeziehungen klassifizieren. Diese Verfahren zeichnen sich dadurch aus, dass sie keine externen, manuell erzeugten Wissensbasen verwenden. Damit besteht keine Notwendigkeit einer manuellen Pflege von Taxonomien für neue Wissensbereiche. Das Verfahren TaxWikiML.KOM erweitert das Verfahren TaxWikiHeur.KOM und behebt einige der bei der Evaluation von TaxWikiHeur.KOM erkannten Mängel. Die Evaluation der Verfahren hat insgesamt gezeigt, dass trotz des Verzichtes auf eine externe Wissensbasis die Güte der Taxonomien sehr gut ist. Die Verwendung der Verfahren erfolgte in fünf Sprachen, so dass der Nachweis der sprachunabhängigen Nutzbarkeit ebenfalls erfolgte.

Das Verfahren TaxWikiML.KOM wurde in der Arbeit weiterhin verwendet, um innerhalb der CROKODIL-Lernumgebung automatisch Beziehungen zwischen von den Benutzern verwendeten Schlagworten zur Beschreibung der im Lernprozess genutzten Ressourcen zu ergänzen. Es konnte zum einen anhand dreier Korpora aus dem Anwendungsfeld der Ressourcen-basierten Lernens nachgewiesen werden, dass die Dichte des semantischen Netzes, die zur Speicherung der Daten (Ressourcen, Tags und Benutzer) benutzt wird, durch das implementierte Konzept größer wird, womit Empfehlungssysteme umfangreichere Informationen zur Generierung von Empfehlungen zur Verfügung stehen, die auch solche Ressourcen anderer Lernender empfehlen können, die mit einer unterschiedlichen Terminologie beschrieben sind. Der positive Einfluss von mittels TaxWikiML.KOM ergänzten Hyponymiebeziehungen zwischen Schlagworten auf die Güte von Empfehlungssystemen wurde in einer weiteren Evaluation anhand des State-of-the-Art Verfahrens FolkRank zusätzlich nachgewiesen.

Schließlich wurde das FReSET-Tool zur Evaluation von Empfehlungssystemen entwickelt. Das Tool wurde bereits in verschiedenen Arbeiten zur Evaluation verwendet, da es einen standardisierten Vergleich von Empfehlungssystemen ermöglicht.

Alternative Abstract:

Alternative Abstract

Language

Due to constantly changing professional environments and the decrease in the half-life of acquired knowledge, flexible forms of knowledge and skills acquisition are required. Nowadays, the knowledge acquired in educational institutions no longer last a lifetime. Rather, there is an increasing need (especially in work processes) for the personal acquisition of knowledge depending on specific tasks. This is called self-directed learning, as learners are responsible for their learning processes. At the same time, the World Wide Web has become one of the most important sources for knowledge acquisition. Self-directed learning using resources from the Internet is also called resource-based learning.

One of the biggest challenges in resource-based learning is finding relevant web resources on the Web. Search engines are very often used for this purpose, but they do not provide assistance in the selection of found resources. Recommender systems can be helpful to find relevant resources. Learners can benefit from resources that other learners with similar knowledge requirements have already found. In larger groups or in a community, there is a high probability that relevant resources have already been found by other people.

The goal of this thesis is to support resource-based learning within a community of learners by recommending knowledge resources that other community members have already found.

To achieve this objective, the application scenario and an example implementation, CROKODIL, were investigated. The investigation revealed that the recommendation of interesting resources is often impossible, if the users use different terminologies for the tagging of resources. Based on this observation, a concept was developed that fills the gaps in the terminology used by the users through the use of a taxonomy. The analysis also reveals that the application scenario is characterized by current terms in multiple languages which are used as tags. A taxonomy used for the purpose of finding relationships between tags must, therefore, be characterized by the fact that it is up-to-date and available in multiple languages. These characteristics make manually created taxonomies unsuitable.

Therefore, two approaches, TaxWikiHeur.KOM and TaxWikiML.KOM, were designed and implemented in order to generate large-scale taxonomies from the online encyclopedia Wikipedia in multiple languages. This is done by classifying pairs of categories from the Wikipedia in hyponymy and non-hyponymy relationships. These methods are characterized by the fact that they do not use external, manually created knowledge bases. Thus there is no need for the manual maintenance of taxonomies for new knowledge fields. TaxWikiML.KOM extends TaxWikiHeur.KOM and fixes some of the recognized shortcomings in the evaluation of TaxWikiHeur.KOM. The evaluation of the whole process has shown that even if no external knowledge base was used, the quality of the taxonomies was still very good. The approaches were evaluated in five different languages, in order to show the language-independency of the approaches.

TaxWikiML.KOM was also used within CROKODIL to complement automatically generated relations between tags used by the users to describe the resources in their learning processes. Based on three corpora obtained from the application scenario, the evaluation could show that the density of the network grew using the implemented concept. Therefore, recommender systems have more information available to generate recommendations and this can be used for recommendations to learners using different terminologies. Additionally, the positive effect on the quality of recommender systems due to hyponymy relations between tags found by TaxWikiML.KOM was demonstrated in a further evaluation based on a state-of-the-Art algorithm.

Finally, the FReSET tool for the evaluation of recommender systems was developed. FReSET can be used for the evaluation of recommender systems as it allows a standardized and thus comparable evaluation of recommender systems.

English

Uncontrolled Keywords:

Ressourcen-basiertes Lernen, Online Communities, Empfehlungssysteme, Wissensbasen, NLP, E-Learning

URN:

urn:nbn:de:tuda-tuprints-33129

Classification DDC:

000 Generalities, computers, information > 004 Computer science
600 Technology, medicine, applied sciences > 620 Engineering and machine engineering

Divisions:

18 Department of Electrical Engineering and Information Technology > Institute of Computer Engineering > Multimedia Communications

Date Deposited:

03 Apr 2013 15:46

Last Modified: