Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen
  5. An Inclusive Notion of Text
 
  • Details
2023
Zweitveröffentlichung
Konferenzveröffentlichung
Verlagsversion

An Inclusive Notion of Text

File(s)
Download
Hauptpublikation
2023.acl-long.633.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 1.28 MB
Download

2023.acl-long.633.mp4
CC BY 4.0 International
Format: Video MP4
Size: 12.15 MB
TUDa URI
tuda/12008
URN
urn:nbn:de:tuda-tuprints-276586
DOI
10.26083/tuprints-00027658
Autor:innen
Kuznetsov, Ilia ORCID 0000-0002-6359-2774
Gurevych, Iryna ORCID 0000-0003-2187-7621
Kurzbeschreibung (Abstract)

Natural language processing (NLP) researchers develop models of grammar, meaning and communication based on written text. Due to task and data differences, what is considered text can vary substantially across studies. A conceptual framework for systematically capturing these differences is lacking. We argue that clarity on the notion of text is crucial for reproducible and generalizable NLP. Towards that goal, we propose common terminology to discuss the production and transformation of textual data, and introduce a two-tier taxonomy of linguistic and non-linguistic elements that are available in textual sources and can be used in NLP modeling. We apply this taxonomy to survey existing work that extends the notion of text beyond the conservative language-centered view. We outline key desiderata and challenges of the emerging inclusive approach to text in NLP, and suggest community-level reporting as a crucial next step to consolidate the discussion.

Sprache
Englisch
Fachbereich/-gebiet
20 Fachbereich Informatik > Ubiquitäre Wissensverarbeitung
DDC
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Veranstaltungstitel
The 61st Annual Meeting of the Association for Computational Linguistics
Veranstaltungsort
Toronto, Canada
Startdatum der Veranstaltung
09.07.2023
Enddatum der Veranstaltung
14.07.2023
Buchtitel
Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)
Startseite
11311
Endseite
11327
Verlag
ACL
Ort der Erstveröffentlichung
Kerrville, TX, USA
Publikationsjahr der Erstveröffentlichung
2023
Verlags-DOI
10.18653/v1/2023.acl-long.633
PPN
519664728
Zusätzliche Links (Organisation)
https://2023.aclweb.org/
ID Nummer
2023.acl-long.633

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.