Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen
  5. A Novel Approach for Identification and Linking of Short Quotations in Scholarly Texts and Literary Works
 
  • Details
2024
Zweitveröffentlichung
Artikel
Verlagsversion

A Novel Approach for Identification and Linking of Short Quotations in Scholarly Texts and Literary Works

File(s)
Download
Hauptpublikation
jcls-3590-arnold.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 405.2 KB
Download

jcls-3590-arnold.xml
CC BY 4.0 International
Format: XML
Size: 85.34 KB
TUDa URI
tuda/12889
URN
urn:nbn:de:tuda-tuprints-289044
DOI
10.26083/tuprints-00028904
Autor:innen
Arnold, Frederik ORCID 0000-0002-0417-4054
Jäschke, Robert ORCID 0000-0003-3271-9653
Kurzbeschreibung (Abstract)

We present two approaches for the identification and linking of short quotations between scholarly works and literary works: ProQuo, a specialized pipeline, and ProQuoLM, a more general language model based approach. Our evaluation shows that both approaches outperform a strong baseline and the overall performance is on the same level. We compare the performance of ProQuoLM on texts with and without (page) reference information and find that reference information is not used. Based on our findings, we propose the following steps for future improvements: further analysis of the influence of a bigger context window for better handling of long distance references and the introduction of positional information of the literary work so that reference information can be utilized by ProQuoLM.

Freie Schlagworte

quotation linking

literary works

scholarly works

machine learning

language models

Sprache
Englisch
Fachbereich/-gebiet
02 Fachbereich Gesellschafts- und Geschichtswissenschaften > Institut für Sprach- und Literaturwissenschaft > Digital Philology - Neuere deutsche Literaturwissenschaft
DDC
800 Literatur > 800 Literatur, Rhetorik, Literaturwissenschaft
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Titel der Zeitschrift / Schriftenreihe
Journal of Computational Literary Studies
Jahrgang der Zeitschrift
2
Heftnummer der Zeitschrift
1
ISSN
2940-1348
Institution der Erstveröffentlichung
Universitäts- und Landesbibliothek Darmstadt
Ort der Erstveröffentlichung
Darmstadt
Publikationsjahr der Erstveröffentlichung
2024
Verlags-DOI
10.48694/jcls.3590
Zusätzliche Infomationen
Urspr. Konferenzveröffentlichung/Originally conference publication: 2nd Annual Conference of Computational Literary Studies (CCLS2023), 22.06.2023-23.06.2023, Würzburg, Germany
Ergänzende Ressourcen (Forschungsdaten)
https://doi.org/10.5281/zenodo.8232596
https://doi.org/10.5281/zenodo.8221381

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.