Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen (aus DeepGreen)
  5. Live blog summarization
 
  • Details
2021
Zweitveröffentlichung
Artikel
Verlagsversion

Live blog summarization

File(s)
Download
Hauptpublikation
s10579-020-09513-5.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 1.66 MB
TUDa URI
tuda/10238
URN
urn:nbn:de:tuda-tuprints-235256
DOI
10.26083/tuprints-00023525
Autor:innen
Avinesh, P. V. S. ORCID 0000-0001-9860-8564
Peyrard, Maxime
Meyer, Christian M. ORCID 0000-0002-8673-7665
Kurzbeschreibung (Abstract)

Live blogs are an increasingly popular news format to cover breaking news and live events in online journalism. Online news websites around the world are using this medium to give their readers a minute by minute update on an event. Good summaries enhance the value of the live blogs for a reader, but are often not available. In this article, (a) we first define the task of summarizing a live blog, (b) study ways of automatically collecting corpora for live blog summarization, and (c) understand the complexity of the task by empirically evaluating well-known state-of-the-art unsupervised and supervised summarization systems on our new corpus. We show that live blog summarization poses new challenges in the field of news summarization, since frequency and positional signals cannot be used. We make our tools publicly available to reconstruct the corpus and to conduct our empirical experiments. This encourages the research community to build upon and replicate our results.

Freie Schlagworte

Live blog summarizati...

Corpus construction

Focused crawling

Online journalism

Sprache
Englisch
Fachbereich/-gebiet
20 Fachbereich Informatik > Ubiquitäre Wissensverarbeitung
Forschungsprojekte und Grants
DFG-Graduiertenkollegs > Graduiertenkolleg 1994 Adaptive Informationsaufbereitung aus heterogenen Quellen
DDC
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
000 Allgemeines, Informatik, Informationswissenschaft > 070 Nachrichtenmedien, Journalismus, Verlagswesen
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Titel der Zeitschrift / Schriftenreihe
Language Resources and Evaluation
Startseite
33
Endseite
62
Jahrgang der Zeitschrift
55
Heftnummer der Zeitschrift
1
ISSN
1574-0218
Verlag
Springer
Ort der Erstveröffentlichung
Dordrecht
Publikationsjahr der Erstveröffentlichung
2021
Verlags-DOI
10.1007/s10579-020-09513-5
PPN
524551820

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.