Korpus

Was ist ein Korpus?

Ein Korpus ist eine wissenschaftlich aufbereitete Sammlung von Beispielen, wie eine Sprache normalerweise verwendet wird. Ein Korpus kann zum Beispiel eine große Zahl schriftlicher Texte oder aufgenommene oder gefilmte Gespräche enthalten. Solche Datensammlungen werden benutzt, um die Verwendung einer Sprache zu untersuchen und etwas über den Wortschatz und die Grammatik dieser Sprache zu erfahren.

Vorgehen

 

Ein Projektziel ist es, ein Korpus zu erstellen, das die Alltagssprache kompetenter gehörloser DGS-Benutzerinnen und -Benutzer widerspiegelt. Dafür wurde bis März 2012 eine bundesweite Erhebung mit 330 Gehörlosen an 12 Orten in Deutschland durchgeführt, um auch regional unterschiedliche Gebärden zu erfassen.


Die Erhebung bestand aus mehreren Teilen: Unter anderem wurden zum Beispiel Unterhaltungen oder Diskussionen zweier Gehörloser zu bestimmten Themen gefilmt sowie verschiedene Aufgaben wie die Nacherzählung einer Bildergeschichte oder eines Films. Die Aufnahmen ergaben über 500 Stunden DGS-Verwendung. Diese Menge an Daten entspricht etwa 3 Mio. Verwendungen von Gebärden (Belege). Diese Größe ist vergleichbar mit Korpora gesprochener Sprachen. Die Aufbereitung des Korpus ist sehr zeitaufwändig. Da die meisten Arbeiten nicht automatisiert werden können, müssen sie von Hand durchgeführt werden.

Nutzungsmöglichkeiten

 

Das Korpus enthält viele Erzählungen, die aus kultureller Sicht für die Gebärdensprachgemeinschaft interessant sind und z.B. in Gehörlosenschulen oder im DGS-Unterricht eingesetzt werden können. Damit diese gebärdeten Geschichten und Gespräche auch allen anderen offenstehen, die sich für die DGS interessieren und Spaß an Gebärdensprache haben, wurden sie bevorzugt für das Öffentliche Korpus ausgewählt. Das Portal Meine DGS (meine-dgs.de) enthält über 47 Stunden DGS-Filme mit diesen Geschichten und Gesprächen, die ins Deutsche übersetzt sind (Untertitel). Zusätzlich wurden 88 Witze (knapp 2,5 Stunden) ausgewählt.

 

Das frei zugängliche Forschungsportal (ling.meine-dgs.de) des Öffentlichen Korpus enthält zusätzlich über 100 Minuten exemplarisch ausgewählte DGS-Filme, um die verschiedenen Aufgaben aus der Erhebung zu zeigen.

Mit Ausnahme der Witze sind alle DGS-Filme auf dieser Seite nicht nur übersetzt, sondern auch annotiert (Glossen, Mundbild/Mundgestik). Mit Ausnahme der Mundbilder sind alle geschriebenen Texte dieser Seite auch auf Englisch verfügbar. Das im Projekt erstellte Korpus soll Sprachwissenschaftlerinnen und -wissenschaftlern auch über die Dauer der Projektlaufzeit hinaus die Möglichkeit geben, verschiedene Aspekte der DGS auf empirischer Basis zu untersuchen.

 

Innerhalb des Projekts wird das Korpus zur Erstellung des Wörterbuchs DGS – Deutsch ausgewertet.