[Elsnet-list] Stellenausschreibung an der TU Darmstadt, FB Informatik, FG UKP - Promotionsstipendien

Birgit Kirchmeier kirchmeier at tk.informatik.tu-darmstadt.de
Fri Aug 13 10:13:24 CEST 2010


3 Promotionsstipendien in Sprachtechnologie und Computerlinguistik
Institution: Ubiquitous Knowledge Processing (UKP) Lab, Fachbereich Informatik, TU Darmstadt
Datum: 01.08.2010
Bewerbungsschluss: 30. September 2011. Auch später eingehende Bewerbungen können berücksichtigt werden, sofern die Stellen noch offen sind.
Der durch die vierte Staffel des hessischen Forschungsförderprogramms LOEWE (Landes-Offensive zur Entwicklung wissenschaftlich-ökonomischer Exzellenz) an der Technischen Universität Darmstadt geförderte LOEWE-Schwerpunkt "Digital Humanities" befasst sich mit sprachtechnologischen Verfahren zur Erschließung von Corpora. Der LOEWE Schwerpunkt vergibt ab dem 01.01.2011
3 Promotionsstipendien
Die Dauer der Stipendien beträgt insgesamt 3 Jahre. Mit dem Stipendium ist die Forschung an einem Dissertationsprojekt im Rahmen des Forschungsprogramms des LOEWE-Schwerpunkts verbunden. Die projektierte Arbeit soll einschlägig für das Forschungsprofil des jeweiligen Teilprojekts sein. Die Möglichkeit zur eigenen wissenschaftlichen Weiterbildung ist neben der Arbeit am Projekt gegeben.
Die Stipendien sind folgenden Teilprojekten zugeordnet:

·         Ein Stipendium im Teilprojekt "Text als Produkt - Maschinelles Lernen für die linguistische Textanalyse".



Seit einiger Zeit werden im Informationsmanagement verstärkt Verfahren des Maschinellen Lernens eingesetzt, etwa in der automatischen Dokumentklassifikation, im Information Retrieval oder bei der Inhaltsaufbereitung von Dokumenten. In diesem Teilprojekt soll untersucht werden, wie beispielsweise Topic Models eingesetzt werden können, um Corpusanalysen zu automatisieren und damit die Betrachtung größerer Datenmengen zu ermöglichen. Topic Models sind probabilistische generative Modelle, die in einer Dokumentensammlung die thematischen Hauptstränge (die Topics) identifizieren, analog zu den Zielen der linguistischen Analyse textbildender Merkmale (Kohäsion und Kohärenz), die sich allerdings auf einzelne Texte beziehen. In diesem Teilprojekt soll ein syntaktisch und semantisch annotiertes Corpus natürlichsprachlicher Texte um das Merkmal lexikalische Kohäsion ergänzt werden. Anschließend werden darauf statistische Modelle, exemplarisch die Topic Models angewandt. Dies dient zur Beantwortung der Frage, wie sich die Ansätze statistischer Semantik zu den vorhandenen linguistischen Kategorien verhalten.



·         Zwei Stipendien im Teilprojekt "Text als Prozess - Linguistische Eigenschaften von kollaborativ erstellten Texten im Web 2.0".



Im sogenannten "Web 2.0" ermöglichen neue Infrastrukturen die Kollaboration an Texten. Durch die niedrige Publikationsschwelle sind hierbei Phänomene wie Mehrautorenschaft,  Änderung/Übernahme von Text(teil)en, Verschmelzen von Autor/Leser etc. eher der Regelfall als die Ausnahme.  Aufgrund ihrer Größe, der Anzahl der (größtenteils anonymen) Autoren und der praktisch lückenlosen Dokumentation des Entstehungsprozesses als Revisionsgeschichte und in Diskussionsseiten, stellt Wikipedia ein einzigartiges Corpus für computerlinguistische Forschung dar, für das es noch keinen Präzedenzfall in der Computerlinguistik gab. Im Teilprojekt soll dieses Corpus auf mehreren Ebenen computerlinguistisch aufbereitet werden. Seine pragmatischen Eigenschaften werden unter dem Einsatz sprachtechnologischer Verfahren systematisch erforscht. Dazu gehören die Fragestellungen wie die Modellierung der Revisionsarten und der Dialogakte auf den Diskussionsseiten, Bestimmung und Anwendung der Merkmale zur automatischen Klassifikation mithilfe der Verfahren des Machine Learning sowie darauf basierende, parametrisierte Analysen, z.B. der Textqualität oder der zeitlichen Entwicklung. Sprach- sowie domänenübergreifende Vergleiche sind in die Analysen einzubeziehen.
Voraussetzung für die Bewerbung ist ein mit sehr guten Ergebnissen abgeschlossenes Hochschulstudium in Informatik, Computerlinguistik, oder verwandten Fächern. Die Stipendien für Doktoranden werden in Höhe von insgesamt 1400 Euro mntl. vergeben.

Die TU Darmstadt ist eine autonome Universität mit breiter Forschungsexzellenz, interdisziplinärem Profil und klaren Schwerpunkten in den Ingenieurwissenschaften und der Informations- und Kommunikationstechnologie. Der Fachbereich Informatik ist ein Leistungsträger der TU Darmstadt in Forschung und Lehre und in einschlägigen bundesweiten Rankings regelmäßig in der Spitzengruppe zu finden. Das Ubiquitous Knowledge Processing (UKP) Lab an der Technischen Universität Darmstadt besteht seit 2007 und hat sich seitdem zu einer international anerkannten Forschungsgruppe auf dem Gebiet der Sprachtechnologie und Computerlinguistik entwickelt. Zu den Alleinstellungsmerkmalen der Forschung am UKP Lab zählen semantische Verfahren der Computerlinguistik, Wissenserschließung im Web 2.0 sowie innovative Anwendungsfelder der Sprachtechnologie in Bildung, Digital Humanities, ziviler Sicherheit und Wissensmanagement.


Die Ausschreibung erfolgt unter Vorbehalt des endgültigen Bewilligungsbescheids durch das Hessische Ministerium für Wissenschaft und Kultur.

Zur Bewerbung senden Sie bitte per Post folgende Unterlagen:

·         Tabellarischer Lebenslauf

·         Kopien der Schul- und Studienabschlusszeugnisse

·         Projektskizze (höchstens 6 Seiten) mit Kurzzusammenfassung, Forschungsüberblick, Fragestellung und Methoden, Bezug und Zuordnung zum Teilprojekt sowie einem beispielhaften Arbeitsplan

·         Vorschläge für zwei Hochschullehrer/innen als Gutachter

·         Exemplar der Abschlussarbeit  (eine CD ist ausreichend)

an: Prof. Dr. Iryna Gurevych, UKP Lab, TU Darmstadt, Hochschulstraße 10, 64289 Darmstadt.

Wir bitten, Bewerbungsunterlagen nur in Kopie vorzulegen, da diese nach Abschluss des Verfahrens nicht zurückgesandt werden. Wenn Sie Fragen zur Ausschreibung haben, wenden Sie sich bitte an: gurevych (at) cs.tu-darmstadt.de

-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://mailman.elsnet.org/pipermail/elsnet-list/attachments/20100813/56de1f9c/attachment-0001.htm 


More information about the Elsnet-list mailing list