Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen
  5. CiteBench: A Benchmark for Scientific Citation Text Generation
 
  • Details
2023
Zweitveröffentlichung
Konferenzveröffentlichung
Verlagsversion

CiteBench: A Benchmark for Scientific Citation Text Generation

File(s)
Download

2023.emnlp-main.455.mp4
CC BY 4.0 International
Format: Video MP4
Size: 50.71 MB
Download
Hauptpublikation
2023.emnlp-main.455.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 647.15 KB
TUDa URI
tuda/12010
URN
urn:nbn:de:tuda-tuprints-276602
DOI
10.26083/tuprints-00027660
Autor:innen
Funkquist, Martin
Kuznetsov, Ilia ORCID 0000-0002-6359-2774
Hou, Yufang
Gurevych, Iryna ORCID 0000-0003-2187-7621
Kurzbeschreibung (Abstract)

Science progresses by building upon the prior body of knowledge documented in scientific publications. The acceleration of research makes it hard to stay up-to-date with the recent developments and to summarize the ever-growing body of prior work. To address this, the task of citation text generation aims to produce accurate textual summaries given a set of papers-to-cite and the citing paper context. Due to otherwise rare explicit anchoring of cited documents in the citing paper, citation text generation provides an excellent opportunity to study how humans aggregate and synthesize textual knowledge from sources. Yet, existing studies are based upon widely diverging task definitions, which makes it hard to study this task systematically. To address this challenge, we propose CiteBench: a benchmark for citation text generation that unifies multiple diverse datasets and enables standardized evaluation of citation text generation models across task designs and domains. Using the new benchmark, we investigate the performance of multiple strong baselines, test their transferability between the datasets, and deliver new insights into the task definition and evaluation to guide future research in citation text generation. We make the code for CiteBench publicly available at https://github.com/UKPLab/citebench.

Sprache
Englisch
Fachbereich/-gebiet
20 Fachbereich Informatik > Ubiquitäre Wissensverarbeitung
DDC
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Veranstaltungstitel
The 2023 Conference on Empirical Methods in Natural Language Processing
Veranstaltungsort
Singapore
Startdatum der Veranstaltung
06.12.2023
Enddatum der Veranstaltung
10.12.2023
Buchtitel
Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing
Startseite
7337
Endseite
7353
Verlag
ACL
Ort der Erstveröffentlichung
Kerrville, TX, USA
Publikationsjahr der Erstveröffentlichung
2023
Verlags-DOI
10.18653/v1/2023.emnlp-main.455
PPN
519653335
Zusätzliche Links (Organisation)
https://2023.emnlp.org/
ID Nummer
2023.emnlp-main.455
Ergänzende Ressourcen (Forschungsdaten)
https://github.com/UKPLab/citebench

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.