Korpora als Grundlage für das Lehren und Lernen von Deutsch als Fremdsprache
Korpora als Grundlage für das Lehren und Lernen von Deutsch als Fremdsprache
Spätestens seit Lemnitzer / Zinsmeister (2015: 13) gilt die Definition von Korpus als einer Sammlung schriftlicher oder gesprochener Äußerungen in einer oder mehreren Sprachen in digitaler Form. Das wissenschaftliche Programm der Korpuslinguistik am Leibniz-Institut für Deutsche Sprache, welches das aktuell größte Korpus in deutscher Sprache vorhält, ist daher auch, „geleitet durch die explorative Analyse von sehr großen Sammlungen natürlichsprachlicher Daten neue Einsichten in die Strukturen, Gesetzmäßigkeiten, Eigenschaften und Funktionen von Sprache zu erlangen“. (https://www.idsmannheim.de/digspra/kl/, 17.10.2021.) Seine Verantwortlichkeit liegt dabei darin, „den deutschen Schriftsprachgebrauch beständig und in angemessener Weise stichprobenartig im Deutschen Referenzkorpus zu dokumentieren“ (ebd.). Das Deutsche Referenzkorpus DeReKo bildet mit aktuell 50,6 Milliarden Wörtern (Stand 02.02.2021) die weltweit größte linguistisch motivierte Sammlung elektronischer Korpora und beinhaltet geschriebene Texte in deutscher Sprache aus der Gegenwart und der neueren Vergangenheit. Die Daten sind über die Korpusrecherchetools COSMAS II und KorAP kostenlos abfragbar und können als Basis für multiple linguistische Fragestellungen verwendet werden (https://www.ids-mannheim.de/digspra/kl/projekte/korpora/, 17.10.2021).

