Prof. Dr. Stefanie Dipper
Linguistische Annotation von Nichtstandardvarietäten – Guidelines und „Best Practices“
Gefördert vom BMBF, Förderung von 2012-2013
Das Projekt zielte darauf ab, den Fokus der Korpuserstellung und -analyse über die Zeitungssprache hinaus auch auf andere Varietäten zu lenken, wie z.B. Sprache im Internet, Sprache von Lernenden oder gesprochene Sprache. Die entsprechenden Sprachdaten stellen etablierte Methoden in Frage. Beispielsweise liefern gängige Tokenizer angewendet auf Chat-Daten nur unbefriedigende Ergebnisse, und Annotationsguidelines sehen keine Richtlinien für die Annotation von abweichenden Strukturen vor, wie man sie in Texten von Deutschlernenden findet.
Projekt in Kooperation mit:
Prof. Dr. Anke Lüdeling, HU Berlin