Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen (aus DeepGreen)
  5. The InsightsNet Climate Change Corpus (ICCC) : Compiling a Multimodal Corpus of Discourses in a Multi-Disciplinary Domain
 
  • Details
2023
Zweitveröffentlichung
Artikel
Verlagsversion

The InsightsNet Climate Change Corpus (ICCC) : Compiling a Multimodal Corpus of Discourses in a Multi-Disciplinary Domain

File(s)
Download
Hauptpublikation
s13222-023-00454-1.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 1.35 MB
TUDa URI
tuda/12445
URN
urn:nbn:de:tuda-tuprints-283563
DOI
10.26083/tuprints-00028356
Autor:innen
Volkanovska, Elena ORCID 0009-0002-8775-6136
Tan, Sherry
Duan, Changxu
Bartsch, Sabine ORCID 0000-0001-7379-2158
Stille, Wolfgang ORCID 0000-0003-4468-4208
Kurzbeschreibung (Abstract)

The discourse on climate change has become a centerpiece of public debate, thereby creating a pressing need to analyze the multitude of messages created by the participants in this communication process. In addition to text, information on this topic is conveyed multimodally, through images, videos, tables and other data objects that are embedded within documents and accompany the text. This paper presents the process of building a multimodal pilot corpus to the InsightsNet Climate Change Corpus (ICCC) and using natural language processing (NLP) tools to enrich corpus (meta)data, thus creating a dataset that lends itself to the exploration of the interplay between the various modalities that constitute the discourse on climate change. We demonstrate how the pilot corpus can be queried for relevant information in two types of databases, and how the proposed data model promotes a more comprehensive sentiment analysis approach.

Freie Schlagworte

Corpus

Climate change

Computational linguis...

Annotation

Metadata

Sprache
Englisch
Fachbereich/-gebiet
02 Fachbereich Gesellschafts- und Geschichtswissenschaften > Institut für Sprach- und Literaturwissenschaft > Corpus- und Computerlinguistik, Englische Philologie
Zentrale Einrichtungen > hessian.AI - Hessisches Zentrum für Künstliche Intelligenz
DDC
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
400 Sprache > 400 Sprache, Linguistik
400 Sprache > 420 Englisch
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Titel der Zeitschrift / Schriftenreihe
Datenbank-Spektrum : Zeitschrift für Datenbanktechnologien und Information Retrieval
Startseite
177
Endseite
188
Jahrgang der Zeitschrift
23
Heftnummer der Zeitschrift
3
ISSN
1610-1995
Verlag
Springer
Ort der Erstveröffentlichung
Berlin ; Heidelberg
Publikationsjahr der Erstveröffentlichung
2023
Verlags-DOI
10.1007/s13222-023-00454-1
PPN
525414177

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.