Humboldt-Universität zu Berlin - Sprach- und literaturwissenschaftliche Fakultät - Institut für Slawistik und Hungarologie

Herr Prof. Dr. Roland Meyer

Erschließung digitaler Textarchive über Metadaten und Lemmata (Kurationsprojekt CLARIN-D F-AG 2-2)

Ziel des Projekts ist die Entwicklung eines Werkzeugs, das eine bessere Erschließung ausgewählter historischer Archive des Polnischen ermöglichen und den Weg zur Erschließung weiterer Archive ebenen soll. Das Suchwerkzeug soll eine Abfrage nach Lemmata ermöglichen und auf der Grundlage von Metadaten ein geeignetes Korpus zusammenstellen. Die dazu benötigten Sekundärdaten und Werkzeuge (Datenbanken, Lexika, morphologische Analysierer) sollen über Webservices bereitgestellt werden. Das Projekt wird am Beispiel des Polnischen ausgeführt, ein mit seinen zahlreichen Flexionen und der starken orthographischen Variation eher schwieriges Fallbeispiel. Dadurch sollte allerdings auch eine bessere Übertragbarkeit des Werkzeugs auf andere Sprachen gewährleistet sein.