RUB » Linguistik » Profil » Projekte

Projekte

Derzeit laufend

Position und Interpretation von adverbialen PPen im deutschen Satz
(Prof. Dr. Tibor Kiss)

(gefördert von der Deutschen Forschungsgemeinschaft)

Beschränkende Beziehungen zwischen der syntaktischen Position und der Interpretation von Adverbialen im deutschen Satz sind Gegenstand einer aktuellen Forschungskontroverse. So postulieren verschiedene Autoren ausgehend von Frey und Pittner (1998) eine Hierarchie von Adverbialklassen im deutschen Satz, die Basispositionen für die Adverbien bedingt. Entsprechend werden Adverbien zueinander und zu den syntaktischen Argumenten des Verbs geordnet. Andere Ansätze sehen die Ursache für Positionsbeschränkungen allein in der Semantik der Adverbien.

Die Ansätze verwenden allerdings jeweils unterschiedliche Klassendefinitionen für die Adverbialklassen, aus der dann Positionen abgeleitet werden können. Eine Definition der Adverbialklassen erfolgt häufig nur illustrativ - entsprechend werden einzelne Beispiele herangezogen, um Eigenschaften der Klassen zu begründen. Auch verzichten viele Ansätze auf eine differenzierte Betrachtung der Adverbialbedeutungen. Darüber hinaus muss die empirische Basis der Untersuchungen kritisch hinterfragt werden. Die Akzeptabilität der Beispiele wird nahezu ausschließlich von den Autoren selbst bewertet. Dazu kommt, dass jeweils nur wenige Beispiele gewählt werden und systematische Variationen der Füllung der Beispiele, etwa durch unterschiedliche Mitglieder der postulierten Klassen unterbleiben.

Im vorliegenden Vorhaben soll daher das Stellungsverhalten ereignis-externer, ereignis-interner und prozess-bezogener adverbialer PPen systematisch analysiert werden. Die Untersuchung ist im ersten Teil korpusbasiert: hierzu werden Belege mit den relevanten Bedeutungen aus einem deutschsprachigen Zeitungskorpus extrahiert. Die Bedeutungen wurden dort anhand des in Kiss et al. (2014, [2]2016) entwickelten Systems annotiert. Es besteht somit die Möglichkeit, Bedeutungen und Präpositionen systematisch zu variieren. Zur Überprüfung der syntaktischen Positionen sind in den bisherigen Forschungsansätzen Testverfahren entwickelt worden sind, die spezifische Kontexte erfordern. Diese spezifischen Kontexte sollen experimentell überprüft werden, die dazu relevanten Daten können aber nicht unmittelbar aus den Korpora extrahiert werden. Deswegen werden im vorliegenden Vorhaben die extrahierten Korpusbelege systematisch im Rahmen eines Annotationssystems ergänzt und verändert und bilden so die Basis für die experimentellen Untersuchungen zur Akzeptabilität und Interpretation bestimmter Abfolgen im zweiten Teil.

Das Gesamtziel des Vorhabens ist eine empirisch gesicherte grammatische Analyse der Abfolgebedingungen von PPen der o.g. drei Klassen.

Link zur Projektseite

Literacy as the key to social participation: Psycholinguistic perspectives on orthography instruction and literacy acquisition.
(Prof. Dr. Eva Belke, Prof. Dr. Stefanie Dipper)

(gefördert von der VolkswagenStiftung im Rahmen der Förderinitiative Schlüsselthemen für Wissenschaft und Gesellschaft. Kooperationsprojekt mit Prof. Dr. Sonia Kandel, Laboratoire Psychologie et Neurocognition, CNRS UMR 5105, Université Grenoble-Alpes, Jun.-Prof. Dr. Claudia Müller, Germanistisches Institut, RUB)

Die Produktion und Rezeption schriftsprachlicher Texte stellt einen wichtigen Baustein zur gesellschaftlichen Teilhabe dar. Allerdings hängt in Deutschland der Grad, wie gut ein Kind schreiben lernt, so stark wie in kaum einem anderen Land der EU mit dem sozioökonomischen Status der Familie zusammen. Das interdisziplinär besetzte Forscherinnen-Team aus Psycholinguistik, Linguistik, Didaktik und kognitiver Psychologie geht davon aus, dass die im Unterricht genutzten Konzepte, die mit sogenannten Anlauttabellen arbeiten, für Kinder ungeeignet sind, um lesen und schreiben zu lernen: Sie überschätzen die Fähigkeiten der Kinder, sich Schrift selbst anzueignen, und leiten oftmals in die Irre. Die Forscherinnen möchten daher untersuchen, welche Rolle die sprachlichen Lernfähigkeiten der Kinder beim Erwerb von Schreiben und Lesen spielen und wie diese optimal gefördert werden können.

Link zur Projektseite

Accounting for the Foundations of Mass (AFM)

(gefördert von der Alexander von Humboldt-Stiftung. Kooperationsprojekt mit Prof. Francis Jeffry Pelletier)

Im Januar 2013 hat die Alexander von Humboldt-Stiftung den mit 250.000 € dotierten Anneliese Maier-Forschungspreis an den kanadischen Sprachwissenschaftler Prof. Francis Jeffry Pelletier (University of Alberta, Edmonton und Simon Fraser University, Burnaby B.C.) verliehen. Am Sprachwissenschaftlichen Institut arbeitet er mit Prof. Kiss zusammen, um sprachvergleichend die Regelhaftigkeiten der Zählbarkeit von Nomen zu erforschen.

Prof. Kiss und Prof. Pelletier arbeiten seit 2010 an einer korpusbasierten Analyse der Zählbarkeit unter besonderer Berücksichtigung der Polysemie und können diese Forschungen nun bis einschließlich 2017 verstetigen.

Link zur Projektseite

Pragmatische Anforderungen an die Generierung von Antworten in einem Verkaufsdialog
(Prof. Dr. Ralf Klabunde)

(gefördert von der Deutschen Forschungsgemeinschaft. Kooperationsprojekt mit Dr. Anton Benz, Zentrum für Allgemeine Sprachwissenschaft, Berlin)

In dem Projekt sollen am Beispiel von Frage-Antwort-Dialogen in einem Verkaufsszenario Relevanzimplikaturen und Framing-Effekte, die bei der Produktion von Antworten berücksichtigt werden, untersucht werden. Das Projekt baut auf spieltheoretischen Modellen der Inhaltsbestimmung auf und soll diese für die Antwortgenerierung verfügbar machen.

Referenzkorpus Frühneuhochdeutsch (1350-1650)
(Prof. Dr. Stefanie Dipper)

(gefördert von der Deutschen Forschungsgemeinschaft. Kooperationsprojekt mit Prof. Wegera, Germanistisches Institut, RUB, Prof. Demske, Univerität Potsdam, Prof. Solms, Universität Halle)

Dieses Projekt setzt zeitlich am Referenzkorpus Mittelhochdeutsch an. Zusammen mit einem analogen Projekt zum Altdeutschen schaffen wir damit ein ausgewogenes, diachrones Korpus des Deutschen, das qualititativ hochwertig transkribiert und annotiert ist.

Link zur Projektseite

Link zu weiteren Infos und Ressourcen von Computational Historical Linguistics des Instituts: CompHist.

Linguistische Annotation von Nichtstandardvarietäten - Guidelines und "Best Practices"
(Prof. Dr. Stefanie Dipper)

(gefördert vom BMBF. Kooperationsprojekt mit Prof. Lüdeling/HU Berlin)

Das Projekt zielt darauf ab, den Fokus der Korpuserstellung und -analyse über die Zeitungssprache hinaus auch auf andere Varietäten zu lenken, wie z.B. Sprache im Internet, Sprache von Lernenden oder gesprochene Sprache. Die entsprechenden Sprachdaten stellen etablierte Methoden in Frage. Beispielsweise liefern gängige Tokenizer angewendet auf Chat-Daten nur unbefriedigende Ergebnisse, und Annotationsguidelines sehen keine Richtlinien für die Annotation von abweichenden Strukturen vor, wie man sie in Texten von Deutschlernenden findet.

Die automatische zeitliche Vermessung sprachlicher Äußerungen im Deutschen, Englischen und Niederländischen: Entwicklung einer Software für experimentelle Psycholinguisten
(Prof. Dr. Eva Belke)

(Kooperationsprojekt mit Dr. Britta Wrede (Universität Bielefeld) und Prof. Dr. Antje Meyer (Max-Planck-Institut für Psycholinguistik, Nijmegen). Gefördert von der Deutschen Forschungsgemeinschaft. Englischer Titel: The automatic temporal alignment of speech in German, British English, and Dutch for psycholinguistic purposes.)

Ziel des Projekts ist die Weiterentwicklung, Evaluation und Distribution einer Software für psycholinguistische Forschungszwecke. In den meisten Sprachproduktionsstudien dienen die Latenz, mit der die Teilnehmer sprachlich auf einen Stimulus reagieren, und/oder die zeitliche Struktur ihrer Äußerungen (Beginn und Ende einzelner Wörter) als abhängige Variablen. Die exakte automatische zeitliche Vermessung sprachlicher Äußerungen von Hand, auf der Basis von Audio-Aufnahmen der Äußerungen der Probanden, ist jedoch mit enormem Messaufwand verbunden.

In dem Projekt wird AUDIOMAX, eine Software zur exakten automatischen zeitlichen Analyse gesprochener Äußerungen mit Hilfe des automatischen Spracherkenners ESMERALDA, weiterentwickelt. In Vorarbeiten konnte AUDIOMAX so weit programmiert werden, dass es forcierte Alignments von Aufnahmen einfachster deutscher Äußerungen mit Hilfe vorhandener Transkriptionen erstellt. Im Projekt wird diese Funktionalität des Programms zunächst auf niederländische und britisch-englische Äußerungen erweitert, die Messgenauigkeit und Benutzerfreundlichkeit des Programms evaluiert und die Distribution dieser Variante von AUDIOMAX als Softwarepaket ermöglicht. In einem zweiten Schritt wird AUDIOMAX auf die Anwendung von vollständig transkribierten, aber weniger restringierten Äußerungen (z.B. in semispontanen Dialogen) erweitert, erneut bzgl. Messgenauigkeit und Benutzerfreundlichkeit evaluiert und veröffentlicht. Wir sind sicher, dass AUDIOMAX Forschungsvorhaben ermöglichen wird, die ansonsten wegen des enormen Kodierungsaufwands nicht realisierbar wären.

St. Anselmi Fragen an Maria - digitale Erschließung, Auswertung und Edition der gesamten deutschsprachigen Überlieferung (14.-16. Jh.)
(Prof. Dr. Stefanie Dipper)

(DFG-Projekt, 2010-2012; parallel dazu läuft ein mediävistisch-philologisches DFG-Projekt von Dr. Schultz-Balluff und Prof. Wegera/Bochum)

Die deutschsprachige Überlieferung des Passionstraktats "St. Anselmi Fragen an Maria", die in einer ungewöhnlich breiten Form vorliegt (36 Handschriften und 8 Drucke des 14.-16. Jahrhunderts), wird erstmals in ihrer Gesamtheit untersucht und gemäß ihrer zeitlichen, räumlichen und überlieferungsgeschichtlichen Zugehörigkeit eingeordnet. Für diese Einordnung werden philologische, linguistische und computerlinguistische Methoden eingesetzt, die sich gegenseitig ergänzen. Dazu werden alle Texte handschriftengetreu transkribiert und semi-automatisch annotiert mit bibliographischer Information, linguistischen Merkmalen und einer Alignierung der parallel überlieferten Texte auf Paragraphen-, Satz- und Wortebene.

Um diesen neuartigen interdisziplinären Ansatz umzusetzen, werden zwei Einzelprojekte eng kooperieren. Im parallel beantragten germanistisch-mediävistischen Projekt wird die Datengrundlage mit manuellen Transkriptionen und Annotationen erstellt, unterstützt durch automatische Methoden, die in diesem computerlinguistischen Projekt entwickelt werden. Die annotierten Daten werden in einer linguistischen Datenbank bereitgestellt, die wiederum dem Parallelprojekt als Basis für die Erstellung einer kritischen Buchedition dienen wird. Zusätzlich wird eine digitale Edition erstellt, die über einen Webbrowser verfügbar gemacht wird. Außerdem wird die sprachliche Variation zwischen den Parallelüberlieferungen durch Berechnung von Ähnlichkeiten auf verschiedenen linguistischen Ebenen (graphematisch, lexikalisch, syntaktisch) untersucht.

Link zur Projektseite

Link zu weiteren Infos und Ressourcen von Computational Historical Linguistics des Instituts: CompHist.

Referenzkorpus Mittelhochdeutsch (1050-1350)
(Prof. Dr. Stefanie Dipper)

(gefördert von der Deutschen Forschungsgemeinschaft. Kooperationsprojekt mit Prof. Wegera/Bochum und Prof. Wich-Reif/Bonn)

In diesem Projekt geht es um die Erstellung eines Referenzkorpus für die mittelhochdeutsche Sprachstufe (1050-1350). Ziel ist es, eine hinlänglich umfangreiche, verlässliche und handschriftengetreue Datenbasis des Mittelhochdeutschen zu schaffen, die historiolinguistische und mediävistische Recherchen in einem Maße erlaubt, das weit über das bisher Mögliche hinausgeht. Dafür wird eine ausgewogene Auswahl an mittelhochdeutschen Texte digital erfasst und mit der folgenden Information annotiert: normalisierte Wortform, Lemma, Wortart, Morphologie.

Link zur Projektseite

Link zu weiteren Infos und Ressourcen von Computational Historical Linguistics des Instituts: CompHist.

Bilinguale Sprachverarbeitung unter Submersionsbedingungen: Eine psycholinguistische Aufarbeitung
(Prof. Dr. Eva Belke)

(gefördert im Rahmen der Initiative "Pro Geisteswissenschaften" der VolkswagenStiftung)

In der Bundesrepublik erwerben viele Heranwachsende die Landessprache Deutsch nicht als Erst- sondern als Zweitsprache, häufig erst mit dem Eintritt in Kindergarten oder in die Schule. Das deutsche Bildungssystem orientiert sich jedoch überwiegend an einsprachigen deutschen Schülern und setzt entsprechende altersgemäße Fähigkeiten im Deutschen bei allen Kindern voraus. Unter solchen schulischen Bedingungen (sog. Submersionsbedingungen) werden die sprachlichen Fähigkeiten mehrsprachiger Kinder, insbesondere im Umgang mit der Schriftsprache, oft nur unzureichend entwickelt. Das kann sich nachhaltig negativ auf den Schulerfolg auswirken. In der psycholinguistischen Forschung zur Sprachverarbeitung bei "bilingualen" Sprechern werden vor allem solche Sprecher untersucht, die eine zweite Sprache von Geburt an oder auf der Basis eines gezielten Unterrichts (als Fremdsprache) erworben haben. Ein Desiderat ist die psycholinguistische Erforschung des Erwerbs einer Zweitsprache unter Submersionsbedingungen. Das Forschungsvorhaben zielt daher darauf ab, die psycholinguistischen Repräsentationen und Prozesse zu spezifizieren, die der Sprachverarbeitung bei bilingualen Sprechern zugrunde liegen, die eine Zweitsprache unter Submersionsbedingungen erwerben (Teilprojekt 1) sowie didaktische Konzepte der Vermittlung des Deutschen als Zweitsprache psycholinguistisch-experimentell zu fundieren (Teilprojekt 2) und zu evaluieren (Teilprojekt 3).

Abgeschlossen

Grammatische Analyse von Präposition-Substantiv-Sequenzen
(Prof. Dr. Tibor Kiss)

(gefördert von der Deutschen Forschungsgemeinschaft)

Nicht-kanonische Kombinationen aus einer Präposition und einem zählbaren Substantiv im Singular wurden bislang in der Syntaxforschung und der Computerlinguistik nur in Teilbereichen beachtet und häufig als nicht regelhaft charakterisiert. Sie verstoßen gegen die universelle Tendenz der geforderten Artikelrealisation bei zählbaren Substantiven im Singular, sind aber dennoch kompositionell und empirisch produktiv. Das vorliegende Vorhaben widmet sich der Grammatik dieser Konstruktionen. Umfangreiche Korpusdaten werden hierzu automatisch und händisch annotiert, im Vordergrund stehen morphologische, syntaktische und semantische Faktoren der nicht-kanonischen Kombinationen und der regulären Präpositional- und Nominalphrasen. Die Daten werden unter Verwendung von Verfahren des Annotation Mining strukturiert und analysiert. Da das Verfahren voraussetzt, dass eine Vielzahl linguistischer Eigenschaften zunächst annotiert wird, für die hier relevanten Faktoren aber nicht in jedem Fall ein Annotationsschema vorliegt, ist die Definition solcher Schemata erforderlich. Die Ergebnisse dieser Untersuchung werden nicht nur in einer für die Grammatikschreibung und die Computerlinguistik nutzbaren Analyse nicht-kanonischer Präpositionalkombinationen liegen, sondern darüber hinaus elektronische Ressourcen bereitstellen, die bislang für das Deutsche nicht vorliegen, insbesondere für die Zählbarkeitspräferenzen der Substantive.

Link zur Projektseite