Was steckt alles hinter dem Language Level Evaluator (LLE)?
Der LLE wurde ermöglicht durch die Zusammenkunft verschiedener Spezialisten und Fachinformationen. Das Kernteam besteht aus Programmierern, Sprachwissenschaftlern und Didaktikern der Firmen L-Pub GmbH und Ernst Klett Sprachen sowie der Technischen Universität Darmstadt. Lesen Sie mehr über die Arbeit der TU Darmstadt in Zusammenhang mit dem LLE.
An dieser Stelle möchten wir das Team und die im LLE verwendeten Quellen vorstellen.
Das Team bei L-Pub
Alle Mitarbeiter der L-Pub GmbH waren in der einen oder anderen Rolle in der Entwicklung des LLE involviert:
- David P. Steel (Konzept, Produktion)
- Franck Valentin (Architektur, Programmierung)
- Leonore Kleinkauf (Koordinierung, Buchführung)
- Vanessa Appoh (Sprachtechnologie, Didaktik)
- Anette John (Kommunikation, PR)
- Battista Vailati (Programmierung)
Das Team bei Ernst Klett Sprachen
Folgende Mitarbeiter der Ernst Klett Sprachen GmbH waren an der Entwicklung des LLE Deutsch beteiligt:
- Elizabeth Webster (Strategie, Vision)
- Hendrik Funke (Planung, Projektleitung)
- Sebastian Weber (Didaktische Leitung)
- Carina Janas (Redaktion)
- Arkadiusz Wrobel (Redaktion)
Das Team der Technischen Universität Darmstadt
Eine Zusammenarbeit mit dem Ubiquitous Knowledge Processing (UKP) Lab der TU Darmstadt wurde ermöglicht dank einer Förderung der Hessen Agentur (LOEWE3-Programm). Folgende Personen der Universität waren in der Entwicklung des LLE involviert:
- Dr. Iryna Gurevych (Leitung des UKP Lab)
- Christian M. Meyer (Projektkoordination)
- Doktorand Ji-Ung Lee (Machine Learning, Deep Learning, Programmierung)
Externe Beraterinnen
Dank einer lokalen EFRE-Förderung haben folgende weitere Personen maßgeblich zu der Entwicklung der ersten Zügen des LLEs beigetragen:
- Margret Rodi (Einstufung nicht klassifizierter Vokabeln, Erstellung von Kriterien für die Einstufung von Texten auf dem GeR, Ausbau/Anpassung der Vokabellisten nach A1-A2, Auswahl und Prüfung der Quellen, Gewichtung: Vokabel, Satzbau, Morphologie für die Sprachvermittlung)
- Kathrin Hein (sprachwissenschaftliche Beratung, Grammatikklassifikation, Systematisierung der Mehrwortlexeme)
Vokabellisten
Der lexikalischen Einstufung liegen Wortlisten aus Profile Deutsch und den Prüfungszielen A1-B2 zugrunde. Beide Listen wurden gemeinsam von dem Goethe-Institut und dem Österreichischen Sprachdiplom Deutsch erarbeitet. Wenn Texte Wörter aufweisen, die nicht in den oben genannten Listen enthalten sind, bringt Ernst Klett Sprachen zusätzlich seine Expertise ein, um eine adäquate Einstufung vorzunehmen. L-Pub setzt weiterhin Algorithmen ein, die zum Beispiel anhand von Wortlängen oder Wortbildungen GeR-Empfehlungen abgeben können.
Technologische Komponente
DKPro Core (ASL/GPL)
Eckart de Castilho, R. and Gurevych, I. (2014). A broad-coverage collection of portable NLP components for building shareable analysis pipelines. In Proceedings of the Workshop on Open Infrastructures and Analysis Frameworks for HLT (OIAF4HLT) at COLING 2014, p 1-11, Dublin, Ireland.
https://www.ukp.tu-darmstadt.de/software/dkpro-core
Apache uimaFIT / UIMA
Ogren, Philip and Bethard, Steven, Building Test Suites for UIMA Components; Proceedings of the Workshop on Software Engineering, Testing, and Quality Assurance for Natural Language Processing (SETQA-NLP 2009), June, 2009, Boulder, Colorado, Association for Computational Linguistics, pages 1-4
http://www.aclweb.org/anthology/W09-1501
https://uima.apache.org/uimafit.html
https://uima.apache.org/index.html
Mate Tools
Bernd Bohnet and Anders Björkelund; Tools for Natural Language Analysis, Generation and Machine Learning
https://code.google.com/p/mate-tools/
Danksagungen
Unser großer Dank gilt an dieser Stelle der Hessen Agentur und dem Loewe3-Programm, die diese Zusammenarbeit mit der TU Darmstadt ermöglichen.
Die Anfänge des LLE-Projektes wurden zudem im Zeitraum 2013 bis 2015 durch eine lokale EFRE-Förderung über die Stadt Offenbach am Main unterstützt.