Was steckt alles hinter dem Language Level Evaluator (LLE)?

Der LLE wurde ermöglicht durch die Zusammenkunft verschiedener Spezialisten und Fachinformationen. Das Kernteam besteht aus Programmierern, Sprachwissenschaftlern und Didaktikern der Firmen L-Pub GmbH und Ernst Klett Sprachen sowie der Technischen Universität Darmstadt. Lesen Sie mehr über die Arbeit der TU Darmstadt in Zusammenhang mit dem LLE.

An dieser Stelle möchten wir das Team und die im LLE verwendeten Quellen vorstellen.

Das Team bei L-Pub

Alle Mitarbeiter der L-Pub GmbH waren in der einen oder anderen Rolle in der Entwicklung des LLE involviert:

  • David P. Steel (Konzept, Produktion)
  • Franck Valentin (Architektur, Programmierung)
  • Leonore Kleinkauf (Koordinierung, Buchführung)
  • Vanessa Appoh (Sprachtechnologie, Didaktik)
  • Anette John (Kommunikation, PR)
  • Battista Vailati (Programmierung)

Das Team bei Ernst Klett Sprachen

Folgende Mitarbeiter der Ernst Klett Sprachen GmbH waren an der Entwicklung des LLE Deutsch beteiligt:

  • Elizabeth Webster (Strategie, Vision)
  • Hendrik Funke (Planung, Projektleitung)
  • Sebastian Weber (Didaktische Leitung)
  • Carina Janas (Redaktion)
  • Arkadiusz Wrobel (Redaktion)

Das Team der Technischen Universität Darmstadt

Eine Zusammenarbeit mit dem Ubiquitous Knowledge Processing (UKP) Lab der TU Darmstadt wurde ermöglicht dank einer Förderung der Hessen Agentur (LOEWE3-Programm). Folgende Personen der Universität waren in der Entwicklung des LLE involviert:

  • Dr. Iryna Gurevych (Leitung des UKP Lab)
  • Christian M. Meyer (Projektkoordination)
  • Doktorand Ji-Ung Lee (Machine Learning, Deep Learning, Programmierung)

Externe Beraterinnen

Dank einer lokalen EFRE-Förderung haben folgende weitere Personen maßgeblich zu der Entwicklung der ersten Zügen des LLEs beigetragen:

  • Margret Rodi (Einstufung nicht klassifizierter Vokabeln, Erstellung von Kriterien für die Einstufung von Texten auf dem GeR, Ausbau/Anpassung der Vokabellisten nach A1-A2, Auswahl und Prüfung der Quellen, Gewichtung: Vokabel, Satzbau, Morphologie für die Sprachvermittlung)
  • Kathrin Hein (sprachwissenschaftliche Beratung, Grammatikklassifikation, Systematisierung der Mehrwortlexeme)

Vokabellisten

Der lexikalischen Einstufung liegen Wortlisten aus Profile Deutsch und den Prüfungszielen A1-B2 zugrunde. Beide Listen wurden gemeinsam von dem Goethe-Institut und dem Österreichischen Sprachdiplom Deutsch erarbeitet. Wenn Texte Wörter aufweisen, die nicht in den oben genannten Listen enthalten sind, bringt Ernst Klett Sprachen zusätzlich seine Expertise ein, um eine adäquate Einstufung vorzunehmen. L-Pub setzt weiterhin Algorithmen ein, die zum Beispiel anhand von Wortlängen oder Wortbildungen GeR-Empfehlungen abgeben können.

Technologische Komponente

DKPro Core (ASL/GPL)

Eckart de Castilho, R. and Gurevych, I. (2014). A broad-coverage collection of portable NLP components for building shareable analysis pipelines. In Proceedings of the Workshop on Open Infrastructures and Analysis Frameworks for HLT (OIAF4HLT) at COLING 2014, p 1-11, Dublin, Ireland.

https://www.ukp.tu-darmstadt.de/software/dkpro-core

Apache uimaFIT / UIMA

Ogren, Philip and Bethard, Steven, Building Test Suites for UIMA Components; Proceedings of the Workshop on Software Engineering, Testing, and Quality Assurance for Natural Language Processing (SETQA-NLP 2009), June, 2009, Boulder, Colorado, Association for Computational Linguistics, pages 1-4

http://www.aclweb.org/anthology/W09-1501

https://uima.apache.org/uimafit.html

https://uima.apache.org/index.html

Mate Tools

Bernd Bohnet and Anders Björkelund; Tools for Natural Language Analysis, Generation and Machine Learning

https://code.google.com/p/mate-tools/

Danksagungen

Unser großer Dank gilt an dieser Stelle der Hessen Agentur und dem Loewe3-Programm, die diese Zusammenarbeit mit der TU Darmstadt ermöglichen.

Die Anfänge des LLE-Projektes wurden zudem im Zeitraum 2013 bis 2015 durch eine lokale EFRE-Förderung über die Stadt Offenbach am Main unterstützt.