TU Darmstadt / ULB / TUprints

THE NOTTDEUYTSCH CORPUS: A corpus of German-language YouTube comments

Cotgrove, Louis (2024)
THE NOTTDEUYTSCH CORPUS: A corpus of German-language YouTube comments.
In: KorDaF – Korpora Deutsch als Fremdsprache, 2023, 3 (2)
doi: 10.26083/tuprints-00027619
Article, Secondary publication, Publisher's Version

[img] Text
kordaf-3841-cotgrove.pdf
Copyright Information: CC BY 4.0 International - Creative Commons, Attribution.

Download (657kB)
[img] Text (XML-Version)
kordaf-3841-cotgrove.xml
Copyright Information: CC BY 4.0 International - Creative Commons, Attribution.

Download (22kB)
Item Type: Article
Type of entry: Secondary publication
Title: THE NOTTDEUYTSCH CORPUS: A corpus of German-language YouTube comments
Language: English
Date: 2 July 2024
Place of Publication: Darmstadt
Year of primary publication: 23 December 2023
Place of primary publication: Darmstadt
Journal or Publication Title: KorDaF – Korpora Deutsch als Fremdsprache
Volume of the journal: 3
Issue Number: 2
DOI: 10.26083/tuprints-00027619
Corresponding Links:
Origin: Secondary publication from TUjournals
Abstract:

In diesem Beitrag wird das Nottinghamer Korpus deutscher YouTube-Sprache (das NottDeuYTSch-Korpus) vorgestellt. Das Korpus hat eine Größe von über 33 Millionen Wörtern, die aus etwa 3 Millionen YouTube-Kommentaren gesammelt wurden. Die Kommentare wurden zwischen 2008 und 2018 veröffentlicht und wurden von einer Gruppe von überwiegend jungen Deutschsprachigen geschrieben. Das NottDeuYTSch-Korpus bietet einen authentischen und repräsentativen sprachlichen Schnappschuss junger Deutschsprachiger und ermöglicht umfangreiche Forschungsmöglichkeiten in verschiedenen linguistischen Bereichen wie Lexik, Morphologie, Syntax, Orthografie, Multilingualismus, sowie Gesprächs- und Diskursanalyse.

Alternative Abstract:
Alternative AbstractLanguage

This paper introduces the Nottinghamer Korpus deutscher YouTube-Sprache (‘The Nottingham German YouTube Language Corpus’ - or NottDeuYTSch corpus). The corpus comprises over 33 million words, taken from roughly 3 million YouTube comments published between 2008 and 2018, written by a young, German-speaking demographic. The NottDeuYTSch corpus provides an authentic and representative linguistic snapshot of young German speakers and offers significant opportunities for in-depth research in several linguistic fields, such as lexis, morphology, syntax, orthography, multilingualism, and conversational and discursive analysis.

English
Uncontrolled Keywords: Korpuslinguistik, digitale Kommunikation, Deutsch, Multilingualismus, Jugendsprache, corpus linguistics, YouTube, CMC, online language, German, multilingualism, youth language
Status: Publisher's Version
URN: urn:nbn:de:tuda-tuprints-276193
Classification DDC: 400 Language > 400 Language, linguistics
Divisions: 02 Department of History and Social Science > Institut für Sprach- und Literaturwissenschaft > Sprachwissenschaft - Mehrsprachigkeit
Date Deposited: 02 Jul 2024 13:53
Last Modified: 22 Jul 2024 08:09
URI: https://tuprints.ulb.tu-darmstadt.de/id/eprint/27619
PPN:
Export:
Actions (login required)
View Item View Item