2024
Zweitveröffentlichung
Artikel
Verlagsversion
Extracting Geographical References from Finnish Literature. Fully Automated Processing of Plain-Text Corpora
Extracting Geographical References from Finnish Literature. Fully Automated Processing of Plain-Text Corpora
File(s)
Kurzbeschreibung (Abstract)
In the Atlas of Finnish Literature 1870-1940 project, we extract geographical information from a Finnish-language corpus of literary texts published between 1870 and 1940. The texts are transformed from plain texts to TEI/XML, and further processed with named entity recognition and linking tools. The results are presented in a web-based environment. This article describes the technical structure of the analysis chain, the tools used and the metaprocesses used to manage the research dataset.
Sprache
Englisch
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Titel der Zeitschrift / Schriftenreihe
Journal of Computational Literary Studies
Jahrgang der Zeitschrift
2
Heftnummer der Zeitschrift
1
ISSN
2940-1348
Institution der Erstveröffentlichung
Universitäts- und Landesbibliothek Darmstadt
Ort der Erstveröffentlichung
Darmstadt
Publikationsjahr der Erstveröffentlichung
2024
Verlags-DOI
Zusätzliche Infomationen
Urspr. Konferenzveröffentlichung/Originally conference publication: 2nd Annual Conference of Computational Literary Studies (CCLS2023), 22.06.2023-23.06.2023, Würzburg, Germany
Ergänzende Ressourcen (Forschungsdaten)

