SFB 732 Inkrementelle Spezifikation im Kontext

Der Sonderforschungsbereich 732 "Inkrementelle Spezifikation im Kontext" wurde 2006 als Kooperation zwischen dem Institut für Linguistik (Fakultät 9) und dem Institut für Maschinelle Sprachverarbeitung (IMS, Fakultät 5) etabliert.  Sprecherin ist die anglistische Linguistin und Trägerin des Gottfried Wilhelm Leibniz-Preises 2014, Prof. Dr. Artemis Alexiadou.  2014 wurde der SFB um eine dritte Förderperiode bis Mitte 2018 verlängert. Die computerlinguistische und phonetische Forschung am IMS ist mit 11 Teilprojekten maßgeblich an dem Unterfangen beteiligt, nicht zuletzt mit sprachtechnologischen Modellen und Verfahren.

Näheres zur Projektstruktur findet sich auf den Webseiten des SFB.

Ausgangspunkt der interdisziplinären Forschung im SFB 732 ist die charakteristische Eigenschaft menschlicher Sprache(n), dass sehr viele sprachliche Ausdrücke für sich genommen mehrdeutig sind und dass sich die intendierte Interpretation erst im jeweiligen Verwendungskontext erschließt.  Dies wird in der linguistischen und computerlinguistischen Theoriebildung durch die inkrementelle Spezifikation von Repräsentationen modelliert, mittels derer der Raum der möglichen Interpretationen über unterschiedliche Ebenen der Sprachbeschreibung hinweg eingeengt wird.

Die Stuttgarter Kooperation vereint eine Reihe von Forschungsparadigmen und methodischen Herangehensweisen, die sich dem verbreiteten Sprachphänomen der Ambiguität aus jeweils verschiedenen Blickwinkeln und mit unterschiedlichen theoretischen Grundannahmen nähern und dabei mit experimentellen Methoden, korpuslinguistischen Studien und Computersimulationen arbeiten.  Zu den eingesetzten Modellierungsrahmen gehören formal-linguistische Theorien der repräsentationellen Unterspezifikation auf Ebene der Phonetik/Phonologie, des Lexikons, der Morphologie und Syntax, der Satz- und der Diskurssemantik, ebenso wie exemplartheoretische Ansätze, die eine detaillierte Abspeicherung von Äußerungsinstanzen im Gedächtnis annehmen, und im Bereich der Computerlinguistik vor allem unterschiedliche probabilistische Modelle der kontextabhängigen Form-Bedeutungs-Relation, deren Parameter mit maschinellen Lernverfahren aus großen Mengen von Korpusdaten abgeschätzt werden, so dass insbesondere distributionelle Eigenschaften der Ausdrücke systematisch erfasst werden.

Gerade das Nebeneinander von alternativen Modellierungsansätzen begünstigt systematische Erkenntnisgewinne zu den Zusammenhängen im komplexen System der sprachlichen Beschreibungsebenen und den jeweiligen Implikationen für eine algorithmische Umsetzung.  So sind aus den SFB-Arbeiten auch zahlreiche Modelle und Werkzeuge für die sprachtechnologische Anwendung hervorgegangen.  Diesem technologisch-infrastrukturellen Aspekt kommt in der Organisation des Verbundprojekts großes Gewicht zu, nicht zuletzt durch eine Anbindung an das BMBF-geförderte Stuttgarter Ressourcen- und Werkzeug-Infrastrukturzentrum am IMS im Rahmen der CLARIN-Initiative.