Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen
  5. From Ontology to Metadata: A Crawler for Script-based Workflows : HOMER: a tool for extraction and re-use of ontology-based metadata in high-performance measurement and computing workflows
 
  • Details
2024
Zweitveröffentlichung
Artikel
Verlagsversion

From Ontology to Metadata: A Crawler for Script-based Workflows : HOMER: a tool for extraction and re-use of ontology-based metadata in high-performance measurement and computing workflows

File(s)
Download
Hauptpublikation
inggrid-3983-chiapparino.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 284.38 KB
Download

inggrid-3983-chiapparino.xml
CC BY 4.0 International
Format: XML
Size: 85.72 KB
TUDa URI
tuda/13305
URN
urn:nbn:de:tuda-tuprints-294433
DOI
10.26083/tuprints-00029443
Autor:innen
Chiapparino, Giuseppe ORCID 0000-0001-8623-1464
Farnbacher, Benjamin ORCID 0000-0002-1489-6501
Hoppe, Nils ORCID 0000-0003-0580-9717
Ralev, Radoslav ORCID 0000-0002-4583-7969
Sdralia, Vasiliki ORCID 0000-0002-7213-5110
Stemmer, Christian ORCID 0000-0002-6904-8315
Kurzbeschreibung (Abstract)

The present work introduces HOMER (High Performance Measurement and Computing tool for Ontology-based Metadata Extraction and Re-use), a python-written metadata crawler that allows to automatically retrieve relevant research metadata from script-based workflows on HPC systems. The tool offers a flexible approach to metadata collection, as the metadata scheme can be read out from an ontology file. Through minimal user input, the crawler can be adapted to the user’s needs and easily implemented within the workflow, enabling to retrieve relevant metadata. The obtained information can be further automatically post-processed. For example, strings may be trimmed by regular expressions or numerical values may be averaged. Currently, data can be collected from text-files and HDF5 files, as well as directly hardcoded by the user. However, the tool has been designed in a modular way, so that it allows straightforward extension of the supported file-types, the instruction processing routines and the post-processing operations.

Freie Schlagworte

Metadata extraction

HPMC

Ontology

Research Data Managem...

Sprache
Englisch
Fachbereich/-gebiet
16 Fachbereich Maschinenbau > Institut für Fluidsystemtechnik (FST) > Forschungsdatenmanagement und digital literacy
DDC
600 Technik, Medizin, angewandte Wissenschaften > 620 Ingenieurwissenschaften und Maschinenbau
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Titel der Zeitschrift / Schriftenreihe
ing.grid : FAIR data management in engineering sciences
Jahrgang der Zeitschrift
1
Heftnummer der Zeitschrift
2
ISSN
2941-1300
Institution der Erstveröffentlichung
Universitäts- und Landesbibliothek Darmstadt
Ort der Erstveröffentlichung
Darmstadt
Publikationsjahr der Erstveröffentlichung
2024
Verlags-DOI
10.48694/inggrid.3983
Zusätzliche Infomationen
2022 NFDI4ing Conference Special Issue
Ergänzende Ressourcen (Forschungsdaten)
https://gitlab.lrz.de/nfdi4ing/crawler/-/tree/master/SimpleApplication_PizzaOntology
https://doi.org/10.14459/2022mp1694401

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.