B4 Otfrid

The corpus can also be viewed and queried at HZSK Annis for SFB-632 page.

Corpus overview

Typecorpus
DescriptionDas Referenzkorpus Altdeutsch erfasst und annotiert die ältesten Sprachdenkmäler des Deutschen vom Beginn der kontinuierlichen schriftlichen Überlieferung um 750 bis etwa 1050 mit einem Umfang von ca. 650 000 Textwörtern. Aufgenommen werden alle in dieser Zeit überlieferten Texte des Althochdeutschen und des Altsächsischen in einer möglichst genauen Wiedergabestufe. Dabei werden die handschriftengetreuesten gedruckten Texteditionen zugrundegelegt. Die Annotation erfasst Header-Informationen, strukturelle (Wort, Satz, Zeile, Absatz etc.) und linguistische Annotationen (Part of Speech-Tagging, Flexionsmorphologie) sowie syntaktische Satzinformationen und erfolgt mit Unterstützung einer semi-automatischen Vorannotation, die mit Hilfe der digitalisierten Sprachstufen- und Textwörterbücher und Glossare zum Althochdeutschen und zum Altsächsischen erzeugt wurde. Die verschiedenen Stufen der Annotation werden in Form einer Mehrebenenarchitektur aufeinander bezogen.
DescriptionThe reference corpus Old German contains (annotated) data from the oldest language monuments of German before the continuous written transduction around 750 until 1050 with approx. 650,000 text words.
Data ownerProf. Dr. Svetlana Petrova
Prof. Dr. Svetlana Petrova
Keywordshistorical texts, religious texts, information structure
LanguageOld High German (goh)
Size300000 Token
LicenseCreative Commons Attribution 3.0 Unported License (academic)
PID http://hdl.handle.net/11022/0000-0000-9B20-D
Documentationonline documentation
zip archive

Downloads

TitleMime-TypeDownload
You do not have access to all resources of this corpus. Please sign in or apply for access.