Referenzkorpus Mittelhochdeutsch (1050–1350)

Wortarten (POS)

Wortarten sind mit HiTS („Historisches Tagset“) annotiert, das im Kontext der Projekte „Referenzkorpus Altdeutsch“ und „Referenzkorpus Mittelhochdeutsch“ entstanden ist. HiTS orientiert sich in großen Teilen am „Stuttgart-Tübingen Tagset“ (STTS)1, dem Standardtagset für neuhochdeutsche Korpora, und übernimmt u.a. das hierarchische Design der Tagnamen.

Tagübersicht

POS Bedeutung
ADJA Adjektiv, attributiv, vorangestellt
ADJD Adjektiv, prädikativ
ADJN Adjektiv, attributiv, nachgestellt
ADJS Adjektiv, substituierend
APPR Präposition
AVD Adverb
AVD-KO* Adverb oder Konjunktion
AVG Relativadverb, generalisierend
AVW Adverb, interrogativ
CARDA Kardinalzahl, attributiv, vorangestellt
CARDD Kardinalzahl, prädikativ
CARDN Kardinalzahl, attributiv, nachgestellt
CARDS Kardinalzahl, substituierend
DDA Determinativ, definit/demonstrativ, attributiv, vorangestellt
DDART Determinativ, definit, artikelartig
DDD Determinativ, definit/demonstrativ, prädikativ
DDN Determinativ, definit/demonstrativ, attributiv, nachgestellt
DDS Determinativ, definit/demonstrativ, substituierend
DGA Determinativ, generalisierend, attributiv, vorangestellt
DGS Determinativ, generalisierend, substituierend
DIA Determinativ, indefinit, attributiv, vorangestellt
DIART Determinativ, indefinit, artikelartig
DID Determinativ, indefinit, prädikativ
DIN Determinativ, indefinit, attributiv, nachgestellt
DIS Determinativ, indefinit, substituierend
DPOSA Determinativ, possessiv, attributiv, vorangestellt
DPOSD Determinativ, possessiv, prädikativ
DPOSN Determinativ, possessiv, attributiv, nachgestellt
DPOSS Determinativ, possessiv, substituierend
DRELS Determinativ, relativisch, substituierend
DWA Determinativ, interrogativ, attributiv, vorangestellt
DWD Determinativ, interrogativ, prädikativ
DWS Determinativ, interrogativ, substituierend
FM Fremdsprachliches Material
ITJ Interjektion
KO* Konjunktion, neben- oder unterordnend
KOKOM Vergleichspartikel
KON Konjunktion, nebenordnend
KOUS Konjunktion, unterordnend
NA Nomen appelativum
NE Eigenname
PAVAP Pronominaladverb, präpositionaler Teil
PAVD Pronominaladverb, pronominaler Teil
PAVG Pronominaladverb, pronominaler Teil, generalisierend
PAVW Pronominaladverb, pronominaler Teil, interrogativ
PG Pronomen, generalisierend
PI Pronomen, indefinit
PPER Pronomen, personal, irreflexiv
PRF Pronomen, personal, reflexiv
PTKA Partikel bei Adjektiv oder Adverb
PTKANT Antwortpartikel
PTKNEG Negationspartikel
PTKVZ Verbzusatz
PW Pronomen, interrogativ
VAFIN Auxiliar, finit
VAIMP Auxiliar, Imperativ
VAINF Auxiliar, Infinitiv
VAPP Auxiliar, Partizip Präteritum, im Verbalkomplex
VAPS Auxiliar, Partizip Präsens, im Verbalkomplex
VMFIN Modalverb, finit
VMIMP Modalverb, Imperativ
VMINF Modalverb, Infinitiv
VMPP Modalverb, Partizip Präteritum, im Verbalkomplex
VMPS Modalverb, Partizip Präsens, im Verbalkomplex
VVFIN Vollverb, finit
VVIMP Vollverb, Imperativ
VVINF Vollverb, Infinitiv
VVPP Partizip Präteritum, im Verbalkomplex
VVPS Partizip Präsens, im Verbalkomplex

Weitere Informationen

Einige Charakteristika von HiTS sind:

  • Teilweise feinere Unterscheidungen (z.B. bei den Pronominaladverbien) und der Sprachstufe angepasste Tagnamen (z.B. definite/indefinite Artikel als Unterklasse der Determinativa) im Vergleich zum STTS.

  • Bei nicht auflösbaren ambigen Strukturen wird die historisch ältere Analyse bevorzugt; z.B. wird bei Konstruktionen, die (noch) als pränominaler Genitiv oder (schon) als Kompositumserstglied analysiert werden könnten, die Genitivlesart annotiert.

  • Tagging von historischen Wortgrenzenauszeichnungen, da häufig Leerzeichen als Kriterium nicht genügen, um (nach heutigem Verständnis sinnvolle) Worteinheiten zu bestimmen; z.B. Getrennt- vs. Auseinanderschreibung von Komposita.

  • Unterscheidung von Lemma vs. Beleg-spezifischer Annotation, z.B. bei der Verwendung eines Adjektivs (Lemma) in der Funktion eines Adverbs (Beleg). Diese Doppeltannotation eignet sich insbesondere für die Untersuchung von Sprachwandelprozessen, die mit einem Wortartwechsel einhergehen.

Detaillierte Informationen zu HiTS, einschließlich einer Übersicht aller enthaltenen Tags und ihrer Bedeutung, finden sich im zugehörigen Paper (Dipper et al., 2013)2.

  1. Schiller, A., Teufel, S., Stöckert, C., & Thielen, C. (1999). Guidelines für das Tagging deutscher Textcorpora mit STTS [Technischer Bericht, Universitäten Stuttgart und Tübingen]. 

  2. Dipper, S., Donhauser, K., Klein, T., Linde, S., Müller, S., & Wegera, K.-P. (2013). HiTS: ein Tagset für historische Sprachstufen des Deutschen. Journal for Language Technology and Computational Linguistics, Special Issue, 28(1), 85–137.