Logo des Repositoriums
  • English
  • Deutsch
Anmelden
Keine TU-ID? Klicken Sie hier für mehr Informationen.
  1. Startseite
  2. Publikationen
  3. Publikationen der Technischen Universität Darmstadt
  4. Zweitveröffentlichungen
  5. THE NOTTDEUYTSCH CORPUS: A corpus of German-language YouTube comments
 
  • Details
2023
Zweitveröffentlichung
Artikel
Verlagsversion

THE NOTTDEUYTSCH CORPUS: A corpus of German-language YouTube comments

File(s)
Download
Hauptpublikation
kordaf-3841-cotgrove.pdf
CC BY 4.0 International
Format: Adobe PDF
Size: 641.6 KB
Download

kordaf-3841-cotgrove.xml
CC BY 4.0 International
Format: XML
Size: 21.95 KB
TUDa URI
tuda/11975
URN
urn:nbn:de:tuda-tuprints-276193
DOI
10.26083/tuprints-00027619
Autor:innen
Cotgrove, Louis ORCID 0000-0002-6058-0436
Kurzbeschreibung (Abstract)

In diesem Beitrag wird das Nottinghamer Korpus deutscher YouTube-Sprache (das NottDeuYTSch-Korpus) vorgestellt. Das Korpus hat eine Größe von über 33 Millionen Wörtern, die aus etwa 3 Millionen YouTube-Kommentaren gesammelt wurden. Die Kommentare wurden zwischen 2008 und 2018 veröffentlicht und wurden von einer Gruppe von überwiegend jungen Deutschsprachigen geschrieben. Das NottDeuYTSch-Korpus bietet einen authentischen und repräsentativen sprachlichen Schnappschuss junger Deutschsprachiger und ermöglicht umfangreiche Forschungsmöglichkeiten in verschiedenen linguistischen Bereichen wie Lexik, Morphologie, Syntax, Orthografie, Multilingualismus, sowie Gesprächs- und Diskursanalyse.

Freie Schlagworte

Korpuslinguistik

digitale Kommunikatio...

Deutsch

Multilingualismus

Jugendsprache

corpus linguistics

YouTube

CMC

online language

German

multilingualism

youth language

Sprache
Englisch
Alternatives Abstract

This paper introduces the Nottinghamer Korpus deutscher YouTube-Sprache (‘The Nottingham German YouTube Language Corpus’ - or NottDeuYTSch corpus). The corpus comprises over 33 million words, taken from roughly 3 million YouTube comments published between 2008 and 2018, written by a young, German-speaking demographic. The NottDeuYTSch corpus provides an authentic and representative linguistic snapshot of young German speakers and offers significant opportunities for in-depth research in several linguistic fields, such as lexis, morphology, syntax, orthography, multilingualism, and conversational and discursive analysis.

Fachbereich/-gebiet
02 Fachbereich Gesellschafts- und Geschichtswissenschaften > Institut für Sprach- und Literaturwissenschaft > Sprachwissenschaft - Mehrsprachigkeit
DDC
400 Sprache > 400 Sprache, Linguistik
Institution
Universitäts- und Landesbibliothek Darmstadt
Ort
Darmstadt
Titel der Zeitschrift / Schriftenreihe
KorDaF – Korpora Deutsch als Fremdsprache
Startseite
225
Endseite
229
Jahrgang der Zeitschrift
3
Heftnummer der Zeitschrift
2
ISSN
2749-4411
Institution der Erstveröffentlichung
Universitäts- und Landesbibliothek Darmstadt
Ort der Erstveröffentlichung
Darmstadt
Publikationsjahr der Erstveröffentlichung
2023
Verlags-DOI
10.48694/kordaf.3841

  • TUprints Leitlinien
  • Cookie-Einstellungen
  • Impressum
  • Datenschutzbestimmungen
  • Webseitenanalyse
Diese Webseite wird von der Universitäts- und Landesbibliothek Darmstadt (ULB) betrieben.