Arbeitspapiere / Project Notes

AP03-2018-01 Öffentliches DGS-Korpus: Annotationskonventionen / Public DGS Corpus: Annotation Conventions version-independent DOI 10.25592/uhhfdm.822

Authors: Konrad, Reiner / Hanke, Thomas / Langer, Gabriele / König, Susanne / König, Lutz / Nishio, Rie / Regen, Anja

Abstract (de): Dieses Arbeitspapier beschreibt die Annotations- und Glossierungskonventionen, die im Öffentlichen DGS-Korpus verwendet werden. Diese stimmen in weiten Teilen mit den Annotationsrichtlinien des DGS-Korpus-Projekts überein, unterscheiden sich jedoch in einigen Details, da z.B. die Einteilung von Tokens in verschiedene Wortformen eines Types mithilfe von Modifikatoren nicht veröffentlicht werden. Diese Tokens werden lediglich als von der Zitatform des Types abweichend gekennzeichnet.

Neben den allgemeinen Regeln zur Annotation der Übersetzungen und Mundbilder, den Segmentierungs- und Lemmatisierungsregeln werden Besonderheiten der Annotation (doppelte Glossierung, Doppel-Token-Tags) erklärt und die im Öffentlichen DGS-Korpus verwendeten Glossierungen im Einzelnen beschrieben. Glossen und z.T. auch Tokens sind mit den Types-Einträgen oder entsprechenden Videosequenzen des Öffentlichen DGS-Korpus verlinkt. Im Anhang werden alle Symbole und Glossierungen als Überblick zusammengefasst.

Abstract (en): This project note describes the annotation and glossing conventions as they apply to the Public DGS Corpus. In many aspects, they are identical to the annotation guidelines used in the DGS-Korpus project. However, not all aspects dealt with in the annotation show in Public Corpus. E.g. our annotation differentiates between different word forms by using qualifiers whereas the Public Corpus annotation just marks tokens as deviating from the citation form.

In addition to explaining the annotation in translation and of mouthings, segmentation and lemmatisation, this texts explains specific approaches such as double glossing, double-token tags and lists special glosses used in the Public DGS Corpus. Glosses as well as some tokens are hyperlinked into the actual data, so the reader is invited to view both the original video as well as the annotation. The first appendix provides an overview of all symbols and gloss categories while the second lists the fingerspelling forms as used in DGS.

Current Version 4.1 (released 2022-06-14) version-specific DOI 10.25592/uhhfdm.10251


BibTeX:

@techreport{dgs_korpus_ap03_2018_01,
  title       = {{\"O}ffentliches {DGS-Korpus:} {Annotationskonventionen} / {Public} {DGS} {Corpus}: Annotation Conventions},
  author      = {Konrad, Reiner and Hanke, Thomas and Langer, Gabriele and K{\"o}nig, Susanne and K{\"o}nig, Lutz and Nishio, Rie and Regen, Anja},
  edition     = {4.1},
  day         = {14},
  month       = jun,
  year        = {2022},
  address     = {Hamburg, Germany},
  institution = {DGS-Korpus project, IDGS, Universität Hamburg},
  number      = {AP03-2018-01},
  doi         = {10.25592/uhhfdm.822},
  url         = {https://www.sign-lang.uni-hamburg.de/dgs-korpus/arbeitspapiere/DGS-Korpus_AP03-2018-01v04.1_en.pdf},
  type        = {Project Note}
}

Superseded Version 4 (released 2022-02-28) version-specific DOI 10.25592/uhhfdm.10244

Superseded Version 3 (released 2020-09) version-specific DOI 10.25592/uhhfdm.1860

Superseded Version 2 (released 2019-09) version-specific DOI 10.25592/uhhfdm.824

Superseded Version 1 (released 2019-02) version-specific DOI 10.25592/uhhfdm.823