KI: Forscher entwickeln automatische Texterkennung für uralte Keilschrifttafeln
Ein Team der Martin-Luther-Universität Halle-Wittenberg (MLU), der Johannes Gutenberg-Universität Mainz und der Fachhochschule Mainz hat eine KI trainiert, die Keilschrift auf der Basis von 3D-Modellen der zu entziffernden Tafeln erkennen kann. Das soll weit bessere Ergebnisse liefern als es bei der Verwendung von Fotos der Fall wäre.
KI erkennt älteste schriftliche Aufzeichnungen der Menschheit
So sei es etwa möglich, den Inhalt mehrerer Tafeln zu durchsuchen und sie miteinander zu vergleichen, erläutern die Wissenschaftler:innen. Außerdem ebne das Verfahren den Weg für völlig neue Forschungsfragen.
Ihren neuen Ansatz testeten die Forscher:innen an 3D-Modellen von fast 2.000 Keilschrifttafeln, darunter rund 50 aus einer Sammlung der MLU. Von solchen teils über 5.000 Jahre alten Tafeln sollen weltweit noch etwa eine Million Stück existieren. Diese Tafeln gehören zu den ältesten erhaltenen schriftlichen Aufzeichnungen der Menschheit.
„Vom Einkaufszettel bis zum Gerichtsurteil findet sich alles darauf. Die Tafeln geben einen Einblick in die Vergangenheit der Menschheit vor mehreren Jahrtausenden. Allerdings sind sie stark verwittert und daher selbst für geübte Augen schwer zu entziffern“, sagt Hubert Mara, Assistenzprofessor an der MLU.
Keilschrifttafeln sind schon konzeptionell schwierig
Das liegt nicht allein an deren Alter. Schon das Konzept der Keilschrifttafel an sich stellt ein Hemmnis für die Lesbarkeit dar. Immerhin handelt es sich um ungebrannte Tonklumpen, in die die Schrift gepresst wurde.
Erschwerend komme hinzu, dass das damalige Schriftsystem sehr komplex gewesen sei und mehrere Sprachen umfasst habe. Man benötige somit nicht nur optimale Lichtverhältnisse nötig, um die Symbole richtig zu erkennen, sondern auch viel Hintergrundwissen.
„Bisher war es schwierig, sich den Inhalt vieler Keilschrifttafeln auf einmal zu erschließen – man muss sozusagen genau wissen, was man wo sucht“, so Mara.
OCR-System für 3D-Schriften
Maras Team entwickelte sein KI-System nach demselben Prinzip wie OCR-Software (optische Zeichenerkennung), die Bilder von Schrift und Text in maschinenlesbaren Text umwandelt. So können die Texte der Keilschrifttafeln einfach weiter verarbeitet werden.
„OCR funktioniert normalerweise mit Fotos oder Scans. Bei Tinte auf Papier oder Pergament ist das kein Problem. Bei Keilschrifttafeln ist es jedoch schwieriger, weil Licht und Blickwinkel die Erkennbarkeit bestimmter Zeichen stark beeinflussen“, erklärt Ernst Stötzner von der MLU.
Weitere Anwendungen denkbar
Bislang kann das neue System „nur“ zwei von zwölf bekannten Keilschriftsprachen erkennen. Die KI ist indes nicht auf diese Tafeln beschränkt, sondern könnte in der Zukunft etwa eingesetzt werden, um verwitterte Inschriften, zum Beispiel auf Friedhöfen, zu entziffern, die wie die Keilschrift dreidimensional sind.
Mara und Stötzner haben ihre Arbeit auf mehreren internationalen Konferenzen vorgestellt, zuletzt auf der International Conference on Computer Vision.