Suchen im Korpus
Beim Zugang zum Korpus via ANNIS können Suchanfragen mittels der ANNIS Query Language (AQL) gestellt werden.
Für einfache Suchanfragen, die kein Verständnis der ANNIS Query Language (AQL) voraussetzen, haben wir außerdem eine vereinfachte Suchmaske entwickelt. Anfragen dort werden in einen AQL-Ausdruck übersetzt, der bei Bedarf auch als Ausgangspunkt für weitere Modifikationen der Anfrage benutzt werden kann.
Beispielanfragen
Hier einige exemplarische Anfragen in der AQL, die in ANNIS verwendet werden könnten (Links zu den entsprechenden Anfragen im REM-Korpus folgen). Zur genaueren Beschreibung und Motivation der Anfragen vgl. Dipper (2015).1
-
Suche nach einer diplomatischen Wortform
tok_dipl = "durch"
-
Suche nach einer anderen diplomatischen Wortform
tok_dipl = "ſoltu"
-
Suche nach einem Lemma (gemäß Lexer)
lemma = "durh"
-
Suche nach einer vereinfachten Wortform
tok_anno = "bluote"
-
Suche nach zwei adjazenten vereinfachten Wortformen
tok_anno = "sol" & tok_anno = "tu" & #1 . #2
-
Suche nach Vorkommen des Lemmas ‘bluot’, die auf ‘e’ enden
tok_anno = /.*e/ & lemma = "bluot" & #1 _=_ #2
-
Suche nach Dativformen des Lemmas ‘bluot’, die nicht auf ‘e’ enden
lemma = "bluot" & inflection = "Dat.Sg" & tok_anno != /.*e/ & #1 _=_ #2 & #1 _=_ #3
-
Suche nach Vorkommen des Lemmas ‘slange’, die morphologisch als feminin markiert sind
inflection = /.*Fem.*/ & lemma = "slange" & #1 . #2
-
Suche nach Pronomen, die von ihrem Lemma her keine (ursprünglichen) Pronomen sind
pos = "PI" & posLemma != /P.*/ & #1 _=_ #2
-
Suche nach flektierten prädikativen Adjektiven im Nominativ
pos = "ADJD" & inflection = /.*Nom.*/ & #1 _=_ #2
-
Suche nach pränominalen Genitiven
inflection = /.*Gen.*/ & pos != "DPOSGEN" & inflection != /.*Gen.*/ & pos = /N.*/ & #1 _=_ #2 & #1 . #3 & #3 _=_ #4
-
Suche nach postnominalen Genitiven
inflection = /.*Gen.*/ & pos != "DPOSGEN" & inflection != /.*Gen.*/ & pos = /N.*/ & #1 _=_ #2 & #3 . #1 & #3 _=_ #4
-
Suche nach drei adjazenten Personalpronomen
pos = "PPER" & pos = "PPER" & pos = "PPER" & #1 . #2 & #2 . #3
-
Suche nach Abfolgen AUX > Voll/Modalverb in Nebensatz
pos = /(KOUS|DREL.*)/ & pos = /(VA|VM)FIN/ & pos = /(VV|VM)(INF|PP)/ & #2 . #3 & #1 .1,10 #2
-
Suche nach Abfolgen Voll/Modalverb > AUX in Nebensatz
pos = /(KOUS|DREL.*)/ & pos = /(VA|VM)FIN/ & pos = /(VV|VM)(INF|PP)/ & #3 . #2 & #1 .1,10 #2
-
Suche Teilsatzgrenze vor einem Punkt gefolgt von einem Satzende
punc = "S*" & tok_dipl = "." & punc = "$E" & #1 . #2 & #2 .1,3 #3
-
Suche nach Univerbierungen mit “dar”
tok_dipl = /dar.*/ & tokenization = /U.*/ & #1 . #2
-
Suche nach dem dritten Glied einer Multiverbierung
tokenization = "MS3"
-
Suche nach einem regulären Ausdruck
norm = /r.*este.*/
-
Suche nach einem * oder $ in einem regulären Ausdruck
punc = /N[\*]|[\$]./
-
Suche nach einem / in einem regulären Ausdruck
lemma = /.*\x2F.*/ & tok_dipl = /da.*/ & #1 _=_ #2
-
Dipper, S. (2015). Annotierte Korpora für die Historische Syntaxforschung: Anwendungsbeispiele anhand des Referenzkorpus Mittelhochdeutsch. Zeitschrift für Germanistische Linguistik, 43(3), 516–563. ↩