|
Methoden der linguistischen Distanzberechnung
HS, Mastermodul Linguistik/Computerlinguistik, SL: 2,5 CPs/PL: 5 CPs
Di 14-16, GB 3/159
Im Seminar wird es darum gehen, Texte mit computerlinguistischen Methoden qualitativ und quantitativ zu vergleichen und ihre sprachliche Nähe bzw. Distanz zu berechnen. Beispielhafte Fragestellungen sind:
- Wie werden Sprachstammbäume wie z.B. der Stammbaum der indogermanischen Sprachfamilie erstellt?
- Wie berechnet man Dialektregionen?
- Worin unterscheiden sich Texte unterschiedlicher Texttypen und -funktionen?
- Worin unterscheiden sich Texte verschiedener Autoren?
Im Seminar werden sprachliche Unterschiede auf verschiedenen linguistischen Ebenen (phonetisch, morphologisch, syntaktisch, lexikalisch) eine Rolle spielen, die sich aufgrund von Sprachwandel und Sprachvariation ergeben. Der Fokus wird dabei auf der automatischen Analyse dieser Unterschiede liegen.
Studien- und Prüfungsleistungen:
- Studienleistung: regelmäßige aktive Mitarbeit, Lektüre, kleines Implementationsprojekt mit Präsentationen und schriftlicher Dokumentation
- Prüfungsleistung: Research Paper
Vorkenntnisse und Teilnahme:
Das Modul richtet sich an Masterstudierende der (Computer-)Linguistik und der Angewandten Informatik. Voraussetzung für die Teilnahme ist deshalb im Normalfall ein abgeschlossenes B.A.-Studium. In Ausnahmefällen können auch nach persönlicher Absprache mit der Seminarleiterin fortgeschrittene B.A.-Studierende teilnehmen, die ihr B.A.-Studium im Wesentlichen abgeschlossen haben und planen, ein Masterstudium aufzunehmen.
Literatur:
Wird im Seminar bekannt gegeben.
Als Grundlagenliteratur für die computerlinguistischen Aspekte des Seminars eignen sich:
Chris Manning and Hinrich Schütze (1999). Foundations of Statistical Natural Language Processing MIT Press. Cambridge, MA.
Dan Jurafsky and James Martin (2000). Speech and Language Processing Englewood Cliffs: Prentice Hall.
|