Kupietz, Marc; Schmidt, Thomas (Hrsg.): Neue Entwicklungen in der Korpuslandschaft der Germanistik. Beiträge zur IDS-Methodenmesse 2022. Tübingen: Narr Francke Attempto, 2023 (Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP) 11). – ISBN 978-3-8233-8602-5. 256 Seiten, € 88,00.

Schwendemann M (2025)

Publication Type: Book chapter / Article in edited volumes

Publication year: 2025

Edited Volumes: Germanistische Linguistik

Book Volume: 52

Pages Range: 328-333

Issue: 2-3

DOI: 10.1515/infodaf-2025-0054

Abstract

Die Korpuslinguistik ist sicherlich eines der dynamischsten Forschungs- und Anwendungsfelder im Bereich der germanistischen Linguistik. Dies verdeutlicht der von Kupietz und Schmidt in der Reihe Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache herausgegebene Sammelband in eindrücklicher Weise. Und gerade diese interdisziplinäre Ausrichtung macht den vorliegenden Band relevant für den Fachkontext DaF/DaZ. Die insgesamt 17 Beiträge haben ihren Ursprung in der Methodenmesse, die regelmäßig auf der Jahrestagung des Leibniz-Instituts für Deutsche Sprache stattfindet. Die Attraktivität einer solchen Messe besteht dabei sicherlich darin, sich in kurzer Zeit über sehr unterschiedliche Projekte und Perspektiven informieren und austauschen zu können. Und dieses Ziel, so viel sei schon hier gesagt, erfüllt auch der vorliegende Band. Wie bei einem echten Besuch der Methodenmesse können sich Lesende von einem spannenden Projekt zum nächsten treiben und beeindrucken lassen.

Thematisch gliedern die beiden Herausgeber die Beiträge in fünf Blöcke: Im ersten werden zwei Korpusprojekte vorgestellt, die sich mit historischen Korpora beschäftigen:

Zunächst stellen Ihden, Schnelle, Schröder und Zeige[1] den Forschungsverbund Deutsch Diachron Digital – Referenzkorpora zur deutschen Sprachgeschichte vor, der durch die Vielfalt an insgesamt fünf historischen Korpora verschiedener Sprachstufen des Deutschen eine „eine zentrale Ressource für die Erforschung der deutschen Sprachgeschichte“ (11) bereitstellt.

Scheurer, Müller, Schroffenegger, Ströbel, Suter und Volk stellen dann im zweiten Beitrag dieses Blocks mit dem 12.000 Briefe umfassenden Briefwechselkorpus ein Unterprojekt des Digitalisierungsprojektes Bullinger Digital vor, das sich mit der Aufbereitung des Werkes des Schweizer Reformators Heinrich Bullinger befasst.

Der zweite Block ist gegenwartssprachlichen Korpora der geschriebenen Sprache gewidmet und versammelt insgesamt drei Beiträge:

Den Auftakt machen Dorn, Höll, Ziegler, Koppensteiner und Pirker, die das Austrian Media Corpus (amc) und seine vielfältigen und leicht zugänglichen Nutzungsmöglichkeiten einführen.

Im darauffolgenden Beitrag stellt Meier-Vieracker seine vielbeachteten Korpora zur Fußballsprache vor, die sowohl ein konstant präsentes Thema beleuchten als auch wertvolle Perspektiven für die „Thematisierung der Fußballsprache im Fremdsprachenunterricht“ (64) liefern.

Der Beitrag von Jablotschkin und Zinsmeister zu LeiKo, einem Vergleichskorpus für Leichte und Einfache Sprache, bildet den Abschluss dieses Blocks.

Im dritten Block folgt die Vorstellung von vier Projekten, die Korpora im Kontext der Erforschung von Social-Media-Kommunikation erstellen bzw. erstellt haben:

Scheffler, Kern und Seemann berichten von „TwiBloCoP (Twitter+Blog Corpus – Parenting)“ (89), mit dessen Hilfe sowohl Twitter- als auch Blogtexte von insgesamt 44 Personen hinsichtlich ihrer individuellen linguistischen Variabilität ausgewertet werden.

Ein in diesem Kontext ebenfalls hoch relevantes Korpus stellt im zweiten Beitrag dieses Blocks Cotgrove vor. Er hat das NottDeuYTSch-Korpus erstellt, das Nottinghamer Korpus deutscher YouTube-Sprache, mit dem Ziel, die von jungen Menschen online produzierte Sprache zu dokumentieren und zu analysieren.

Bick und Geyer beschäftigen sich aus sprachvergleichender Perspektive mit dem deutsch-dänischen XPEROHS-Korpus und ebenfalls mit online produzierter Sprache und nehmen dabei vor allem das leider virulente Phänomen der Hassrede in den Fokus.

Zuletzt runden Krasselt, Dreesen, Fluor und Rothenhäusler den Themenblock mit ihrem Beitrag zur Korpusfamilie Swiss-AL ab, welche „die gegenwärtig größte Sammlung linguistisch annotierter, digitaler Textdaten in allen vier Landessprachen der Schweiz“ (127) darstellt.

Block vier widmet sich Korpora der gesprochenen Sprache und stellt mit insgesamt fünf Beiträgen den umfangreichsten Einzelpart des Bandes dar:

Den Auftakt bilden Korecky-Kröll, Wittibschlager, Pluschkovits, Tavernier, Fanta-Jende, Stiglbauer, Bal, Kranawetter und Stocker mit der Vorstellung von Teilprojekten aus dem SFB „Deutsch in Österreich. Variation – Kontakt – Perzeption“ (143), in dessen Kontext u. a. Korpora erhoben wurden, die die Sprachvariation in Österreich erforschbar machen sollen.

Belz, Sell, Lange, Terada, Mooshammer und Lüdeling stellen mit dem Berlin Dialogue Corpus (BeDiaCo) und dem Corpus of Non-Native Adressee Register (CoNNAR) zwei phonetische Gesprächskorpora vor, die unter anderem auf Variation bei L1-Sprechenden in der Kommunikation mit Personen, die Deutsch als L2 sprechen, abzielen.

Mit den Korpora Emigrantendeutsch in Israel (IS), Emigrantendeutsch in Israel: Wiener in Jersualem (ISW) und Zweite Generation deutschsprachiger Migranten in Israel (ISZ) stellen Betten, Flinz und Leonardi eine weitere Korpusfamilie von Gesprächskorpora vor, die über das Archiv für Gesprochene Sprache (AGD) zugänglich sind.

Fischer, Ganswindt und Oberdorfer präsentieren in ihrem Beitrag sowohl die Tonkorpora des Recherche- und Dokumentationszentrums des Forschungszentrums Deutscher Sprachatlas als auch das im Aufbau befindliche Regionalsprachekorpus aus dem Projekt Regionalsprache.de.

Ein besonderes Citizen Science-Projekt stellt das von Kruijt, Rabanus und Tagliani beschriebene VinKo dar, in dem Daten von elf deutschen und italienischen Dialekten und Minderheitensprachen in Norditalien gesammelt werden.

Den fünften und letzten Block bilden dann zwei Lernerkorpusprojekte sowie ein Beitrag zu Korpusprojekten im Kontext der Erforschung von Gebärdensprache:

Zunächst stellen Hachmeister, Tietjens, Wanka, Stehr und Becker-Mrotzek die Forschungsdatenbank Lernertexte (FD-Lex) vor, in der perspektivisch schriftliche Daten aus verschiedenen Forschungsprojekten gesammelt und zugänglich gemacht werden sollen.

Darauf stellen Li und Wu das Projekt Chinesisches Deutschlernerkorpus vor, bei dem in ganz China schriftliche Sprachdaten von Schüler:innen und Studierenden gesammelt, annotiert und ausgewertet werden.

Den Abschluss des Bandes bildet der Beitrag von Konrad, Bleicken, Khan, Isard, Langer, Müller und Schulder, die mit dem DGS-Korpus und dem Digitale[n] Wörterbuch der Deutschen Gebärdensprache zwei Projekte aus dem Kontext zur Erforschung von Gebärdensprache vorstellen.

Schon diese minimale Darstellung verdeutlicht die Perspektivenvielfalt der Beiträge, und so ist ein großer Verdienst des Bandes die Tatsache, dass auf sehr engem Raum sowohl aktuelle Herausforderungen wie auch Innovationen und Weiterentwicklungen des Feldes vorgestellt werden. Eine Herausforderung ist die konstant dynamische Natur des Deutschen, die mit einer großen Variation auf vielen Ebenen einhergeht. Aus historischer Perspektive zielen etwa die Korpora in den Beiträgen von Ihden et al. und Scheurer et al. auf die Erforschung diachroner Variation. Gegenwartssprachliche Korpora wie in den Beiträgen von Korecky-Kröll et al. und Dorn et al. fokussieren genre- und medienabhängige Variation. Im Beitrag von Scheffler et al. wurde individuelle Variation in unterschiedlichen sozialen Netzwerken beleuchtet, und die von Belz et al. beschriebenen Korpora nehmen unter anderem individuelle Sprachvariation und potenzielle Anpassungsphänomene an L2-Sprechende durch L1-Sprechende in den Blick.

Eine große technische Herausforderung stellt nach wie vor die Pseudonymisierung oder sogar Anonymisierung von Korpusdaten dar, besonders dann, wenn Korpusbelege aus sozialen Netzwerken aufbereitet, veröffentlicht und verlinkt werden sollen. Dies verdeutlichen z. B. die Beiträge von Scheffler et al., Cotgrove und auch Bick/Geyer. Gerade vor dem Hintergrund der Relevanz solcher Daten ist dies eine nach wie vor drängende Frage.

Deutlich wird bei der Lektüre der einzelnen Beiträge des Bandes immer wieder der Wunsch, niedrigschwellige Zugänge zu den eigenen Forschungsdaten und den erstellten Werkzeugen bereitzustellen (z. B. durch eine Nutzung der Daten direkt im Browser und ohne vorherige Anmeldung wie bei Swiss-AL, Krasselt et al.). Bis jetzt stellt der Zugang zu Korpora oft eine Hürde dar, deren Überwindung dann ein hohes Maß an korpuslinguistischem Fachwissen voraussetzt. Gerade der Abbau solcher Zugangshürden kann dann aber die gesellschaftliche Nutzung der aufbereiteten Korpusressourcen fördern. So werden die Korpora von Swiss-AL etwa zur Wahl des Schweizer Wort des Jahres herangezogen.

Als besonders innovativ erscheint die Verbindung von Korpuslinguistik und Citizen Science. Im VinKo-Projekt (vgl. Kruijt et al.) wird ein Crowdsourcing eingesetzt, das es allen interessierten Sprechenden ermöglicht, mit Hilfe des eigenen Smartphones und ohne große weitere technische Hürden Sprachdaten beizutragen, die dann weiter aufbereitet werden können.

Besondere gesellschaftliche Relevanz kommt zuletzt Projekten zu, die die Dokumentation und Sichtbarmachung marginalisierter Sprachgemeinschaften, Lebenswirklichkeiten und von Minderheitensprachen zum Ziel haben. Hier sind die Beiträge zur Leichten und Einfachen Sprache (Jablotschkin/Zinsmeister), zur Situation deutschsprachiger Gemeinschaften in Israel (Betten et al.) und zu Dialekten und Minderheitensprachen in Norditalien (Kruijt et al.) hervorzuheben, die so diesen Varietäten zu einer notwendigen und größeren Öffentlichkeit verhelfen und dabei auch Sprechende von Minderheitensprachen dabei unterstützen können, positive Einstellungen zur eigenen Sprache und deren Wert auszubilden. Im Falle der Korpora zur deutschen Gebärdensprache kommt als zusätzlicher Faktor dazu, dass systematische Korpora bei der Etablierung eines Notationssystems und der Standardisierung der Deutschen Gebärdensprache eine wichtige Rolle spielen können (vgl. Konrad et al.: 237).

Die größte Relevanz für den Forschungskontext DaF/DaZ bilden sicherlich die Beiträge aus dem letzten Teil. Aus didaktischer Perspektive könnten die regionalsprachlichen Korpora aus dem Projekt Regionalssprache.de von Bedeutung sein, da sie durchaus geeignetes Material für unterrichtliche Kontexte zum Thema Dialekte und Variation etc. bieten (vgl. Fischer et al.). Das CDLK, das im Beitrag von Li/Wu beschrieben wird, ist eines der größeren internationalen Lernerkorpusprojekte mit Deutsch als L2 und zielt mit chinesischen Lernenden auf eine hochrelevante und in den letzten Jahren rapide anwachsende Gruppe von Lernenden. Hachmeister et al. verdeutlichen in ihrem Beitrag das nach wie vor drängende Desiderat einer geeigneten und institutionell dauerhaft angebundenen Infrastruktur für L2-Daten des Deutschen.

Abschließend ist der Band allen korpuslinguistisch Forschenden zu empfehlen, die sich einen Überblick über wesentliche Entwicklungen der letzten Jahre verschaffen wollen. Die Beiträge sind aber ebenso für Studierende und Interessierte, die einen ersten informierenden Zugang zum Feld suchen, aufschluss- und ertragreich. Wahrscheinlich müsste ein Band wie der hier vorliegende in sehr kurzen Abständen immer wieder neu herausgegeben werden, um auch nur halbwegs zeitnah aktuelle Tendenzen abbilden zu können. Und natürlich zeigt der Band nur eine kleine Auswahl der korpuslinguistischen Projekte, die gerade im Kontext der germanistischen Linguistik an zahlreichen Standorten realisiert werden. Diese Auswahl ist aber überaus gelungen und gerade aus der Perspektive von DaF/DaZ sind solche Einblicke besonders deshalb wertvoll, weil sie durch die kompakte Zusammenschau unterschiedlicher Projekte, die sich mit sehr verschiedenen Sprachdaten beschäftigen, zahlreiche wertvolle und konkrete Anknüpfungspunkte für die Weiterentwicklung von Lehr- und Lernmaterialien, die Gestaltung von Unterricht und die Erforschung des Erwerbs und der Entwicklung von Deutsch als Fremd- und Zweitsprache liefern.

Authors with CRIS profile

Matthias Schwendemann

Involved external institutions

Universität Leipzig

Germany (DE)

How to cite

APA:

Schwendemann, M. (2025). Kupietz, Marc; Schmidt, Thomas (Hrsg.): Neue Entwicklungen in der Korpuslandschaft der Germanistik. Beiträge zur IDS-Methodenmesse 2022. Tübingen: Narr Francke Attempto, 2023 (Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP) 11). – ISBN 978-3-8233-8602-5. 256 Seiten, € 88,00. In Germanistische Linguistik. (pp. 328-333).

MLA:

Schwendemann, Matthias. "Kupietz, Marc; Schmidt, Thomas (Hrsg.): Neue Entwicklungen in der Korpuslandschaft der Germanistik. Beiträge zur IDS-Methodenmesse 2022. Tübingen: Narr Francke Attempto, 2023 (Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP) 11). – ISBN 978-3-8233-8602-5. 256 Seiten, € 88,00." Germanistische Linguistik. 2025. 328-333.

BibTeX: Download