Korpuslinguistik und Mündlichkeit. Methodische und technische Herausforderungen bei der Erstellung eines fachspezifischen Korpus zur Verständigung über Literatur im Deutschunterrichtsdiskurs auf der Grundlage archivierter Transkripte
Korpuslinguistik und Mündlichkeit. Methodische und technische Herausforderungen bei der Erstellung eines fachspezifischen Korpus zur Verständigung über Literatur im Deutschunterrichtsdiskurs auf der Grundlage archivierter Transkripte
Der Beitrag setzt sich mit den methodischen und technischen Herausforderungen auseinander, die im Rahmen des Dissertationsprojektes "Musterhafter Sprachgebrauch beim Sprechen über Literatur im Deutschunterrichtsdiskurs. Eine korpuslinguistische Untersuchung von Deutschunterrichtstranskripten" bei der Erstellung eines fachspezifischen Korpus auf der Grundlage archivierter Transkripte aus unterschiedlichen Projektkontexten aufgetreten sind. Dabei wird zum einen auf die Anforderungen der Erstellung eines fachspezifischen Korpus mit gesprochensprachlichen Daten eingegangen, indem auf einer theoretischen Ebene Merkmale der Verständigung über Literatur im Deutschunterricht erläutert werden. Auf dieser Grundlage wird zum anderen aufgezeigt, welche Aufbereitungsschritte in dem Projekt die maschinelle, korpuslinguistische Analyse der Daten ermöglichen. In einem Fazit werden die Grenzen und Potenziale dieses Zugriffs diskutiert.
This article deals with the methodological and technical challenges that arose in the course of the dissertation project "Musterhafter Sprachgebrauch beim Sprechen über Literatur im Deutschunterrichtsdiskurs. Eine korpuslinguistische Untersuchung von Deutschunterrichtstranskripten" during the creation of a subject-specific corpus on the basis of archived transcripts from different project contexts. On the one hand, the requirements of creating a subject-specific corpus with spoken language data are addressed by explaining, on a theoretical level, characteristics of communication about literature in German classes. On this basis, it will be shown on the other hand, which processing steps in the project enable the machine-based, corpus-linguistic analysis of the data. In a conclusion, the limits and potentials of this approach will be discussed.

