Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Erstveröffentlichungen
  5. C-BERT: Factorized Causal Relation Extraction
 
  • Details
2026
Erstveröffentlichung
Preprint

C-BERT: Factorized Causal Relation Extraction

File(s)
Download
Hauptpublikation
pdj_cbert.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 222.52 KB
TUDa URI
tuda/15159
URN
urn:nbn:de:tuda-tuda-151591
DOI
10.26083/tuda-7797
Autor:innen
Johnson, Patrick David ORCID 0009-0005-7745-6561
Kurzbeschreibung (Abstract)

Existing causal relation extraction (CRE) systems prioritize binary (cause, effect) tuples, discarding strength distinctions. We introduce C-BERT, a multi-task transformer that extracts fine-grained relations as (C, E, I) triples, where I E [-1, +1] encodes signed influence. Our key contribution is a factorized architecture decomposing influence into three linguistically motivated classification heads – role, polarity, and salience – coupled with a negation-aware annotation framework that distinguishes indicator-based, propositional, and object negation. On German biodiversity discourse (2,391 relations), the factorized model consistently outperforms unified classification across five random seeds (0.768 ± 0.009 vs. 0.744 ± 0.007 reconstructed accuracy). Decomposed error analysis shows that factorization reduces multi-head error cascades and concentrates failures in single, interpretable subtasks. We release both model variants, code, and a data subset of German parliamentary debates.

Freie Schlagworte

Causal relation extra...

multi-task learning

factorized classifica...

German NLP

causal semantics

negation handling

transformer fine-tuni...

Sprache
Englisch
Fachbereich/-gebiet
02 Fachbereich Gesellschafts- und Geschichtswissenschaften > Institut für Sprach- und Literaturwissenschaft > Germanistik – Angewandte Linguistik
DDC
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
400 Sprache > 400 Sprache, Linguistik
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
PPN
542322293
Ergänzende Ressourcen (Forschungsdaten)
https://huggingface.co/datasets/pdjohn/bundestag-causal-attribution
Ergänzende Ressourcen (Code)
https://github.com/padjohn/cbert

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.