Wortarten (POS)
Wortarten sind mit HiTS („Historisches Tagset“) annotiert, das im Kontext der Projekte „Referenzkorpus Altdeutsch“ und „Referenzkorpus Mittelhochdeutsch“ entstanden ist. HiTS orientiert sich in großen Teilen am „Stuttgart-Tübingen Tagset“ (STTS)1, dem Standardtagset für neuhochdeutsche Korpora, und übernimmt u.a. das hierarchische Design der Tagnamen.
Tagübersicht
POS | Bedeutung |
---|---|
ADJA | Adjektiv, attributiv, vorangestellt |
ADJD | Adjektiv, prädikativ |
ADJN | Adjektiv, attributiv, nachgestellt |
ADJS | Adjektiv, substituierend |
APPR | Präposition |
AVD | Adverb |
AVD-KO* | Adverb oder Konjunktion |
AVG | Relativadverb, generalisierend |
AVW | Adverb, interrogativ |
CARDA | Kardinalzahl, attributiv, vorangestellt |
CARDD | Kardinalzahl, prädikativ |
CARDN | Kardinalzahl, attributiv, nachgestellt |
CARDS | Kardinalzahl, substituierend |
DDA | Determinativ, definit/demonstrativ, attributiv, vorangestellt |
DDART | Determinativ, definit, artikelartig |
DDD | Determinativ, definit/demonstrativ, prädikativ |
DDN | Determinativ, definit/demonstrativ, attributiv, nachgestellt |
DDS | Determinativ, definit/demonstrativ, substituierend |
DGA | Determinativ, generalisierend, attributiv, vorangestellt |
DGS | Determinativ, generalisierend, substituierend |
DIA | Determinativ, indefinit, attributiv, vorangestellt |
DIART | Determinativ, indefinit, artikelartig |
DID | Determinativ, indefinit, prädikativ |
DIN | Determinativ, indefinit, attributiv, nachgestellt |
DIS | Determinativ, indefinit, substituierend |
DPOSA | Determinativ, possessiv, attributiv, vorangestellt |
DPOSD | Determinativ, possessiv, prädikativ |
DPOSN | Determinativ, possessiv, attributiv, nachgestellt |
DPOSS | Determinativ, possessiv, substituierend |
DRELS | Determinativ, relativisch, substituierend |
DWA | Determinativ, interrogativ, attributiv, vorangestellt |
DWD | Determinativ, interrogativ, prädikativ |
DWS | Determinativ, interrogativ, substituierend |
FM | Fremdsprachliches Material |
ITJ | Interjektion |
KO* | Konjunktion, neben- oder unterordnend |
KOKOM | Vergleichspartikel |
KON | Konjunktion, nebenordnend |
KOUS | Konjunktion, unterordnend |
NA | Nomen appelativum |
NE | Eigenname |
PAVAP | Pronominaladverb, präpositionaler Teil |
PAVD | Pronominaladverb, pronominaler Teil |
PAVG | Pronominaladverb, pronominaler Teil, generalisierend |
PAVW | Pronominaladverb, pronominaler Teil, interrogativ |
PG | Pronomen, generalisierend |
PI | Pronomen, indefinit |
PPER | Pronomen, personal, irreflexiv |
PRF | Pronomen, personal, reflexiv |
PTKA | Partikel bei Adjektiv oder Adverb |
PTKANT | Antwortpartikel |
PTKNEG | Negationspartikel |
PTKVZ | Verbzusatz |
PW | Pronomen, interrogativ |
VAFIN | Auxiliar, finit |
VAIMP | Auxiliar, Imperativ |
VAINF | Auxiliar, Infinitiv |
VAPP | Auxiliar, Partizip Präteritum, im Verbalkomplex |
VAPS | Auxiliar, Partizip Präsens, im Verbalkomplex |
VMFIN | Modalverb, finit |
VMIMP | Modalverb, Imperativ |
VMINF | Modalverb, Infinitiv |
VMPP | Modalverb, Partizip Präteritum, im Verbalkomplex |
VMPS | Modalverb, Partizip Präsens, im Verbalkomplex |
VVFIN | Vollverb, finit |
VVIMP | Vollverb, Imperativ |
VVINF | Vollverb, Infinitiv |
VVPP | Partizip Präteritum, im Verbalkomplex |
VVPS | Partizip Präsens, im Verbalkomplex |
Weitere Informationen
Einige Charakteristika von HiTS sind:
-
Teilweise feinere Unterscheidungen (z.B. bei den Pronominaladverbien) und der Sprachstufe angepasste Tagnamen (z.B. definite/indefinite Artikel als Unterklasse der Determinativa) im Vergleich zum STTS.
-
Bei nicht auflösbaren ambigen Strukturen wird die historisch ältere Analyse bevorzugt; z.B. wird bei Konstruktionen, die (noch) als pränominaler Genitiv oder (schon) als Kompositumserstglied analysiert werden könnten, die Genitivlesart annotiert.
-
Tagging von historischen Wortgrenzenauszeichnungen, da häufig Leerzeichen als Kriterium nicht genügen, um (nach heutigem Verständnis sinnvolle) Worteinheiten zu bestimmen; z.B. Getrennt- vs. Auseinanderschreibung von Komposita.
-
Unterscheidung von Lemma vs. Beleg-spezifischer Annotation, z.B. bei der Verwendung eines Adjektivs (Lemma) in der Funktion eines Adverbs (Beleg). Diese Doppeltannotation eignet sich insbesondere für die Untersuchung von Sprachwandelprozessen, die mit einem Wortartwechsel einhergehen.
Detaillierte Informationen zu HiTS, einschließlich einer Übersicht aller enthaltenen Tags und ihrer Bedeutung, finden sich im zugehörigen Paper (Dipper et al., 2013)2.
-
Schiller, A., Teufel, S., Stöckert, C., & Thielen, C. (1999). Guidelines für das Tagging deutscher Textcorpora mit STTS [Technischer Bericht, Universitäten Stuttgart und Tübingen]. ↩
-
Dipper, S., Donhauser, K., Klein, T., Linde, S., Müller, S., & Wegera, K.-P. (2013). HiTS: ein Tagset für historische Sprachstufen des Deutschen. Journal for Language Technology and Computational Linguistics, Special Issue, 28(1), 85–137. ↩