News

Mozilla veröffentlicht größte frei zugängliche Sprachdatensammlung der Welt

(Foto: Mozilla)

Mozilla hat die bislang größte frei zugängliche Sprachdatensammlung veröffentlicht. Darin befinden sich Aufnahmen von mehr als 42.000 Menschen in 18 Sprachen.

Spracherkennung ist ein gut dokumentiertes Feld. Dass dennoch kaum ernstzunehmende Open-Source-Alternativen zu Alexa, Siri oder dem Google Assistant existieren, liegt vor allem an der hohen Menge an Trainingsdaten, die entsprechende Systeme benötigen, um gesprochene Sprache zu erkennen. 2017 startete Mozilla daher das Common-Voice-Projekt. Unterstützerinnen und Unterstützer waren dazu aufgerufen, vorgegebene Sätze einzusprechen, um so eine gemeinfreie Sprachdatenbank aufzubauen. Das Projekt fand rege Unterstützung und Mozilla konnte jetzt die wohl weltweit größte gemeinfreie Sprachdatensammlung veröffentlichen.

Insgesamt enthält das Paket fast 1.400 Stunden an Sprachaufnahmen, die wiederum von 42.000 Freiwilligen beigesteuert wurden. Der Common-Voice-Datensatz beschränkt sich nicht nur auf das Englische, sondern enthält Aufnahmen in 17 weiteren Sprachen. Darunter auch Deutsch, Französisch und Mandarin. Alle Daten stehen unter der freien CC0-Lizenz. Sie sind damit gemeinfrei und können ohne jegliche Einschränkungen von jeder interessierten Partei genutzt werden.

Grundlage für freie Spracherkennungslösungen: Mozillas Common-Voice-Datensatz in Zahlen. (Grafik: Mozilla)
Grundlage für freie Spracherkennungslösungen: Mozillas Common-Voice-Datensatz in Zahlen. (Grafik: Mozilla)

Common Voice: Mozilla will eine möglichst diverse Sprachdatenbank aufbauen

Langfristig soll der Sprachkorpus noch deutlich anwachsen. Schon jetzt sammelt Common Voice Aufnahmen in 22 Sprachen. 70 weitere sind in Planung. Darunter befinden sich dann auch Sprachen, die einen eher geringen Verbreitungsgrad aufweisen oder in Regionen gesprochen werden, die eine geringe wirtschaftliche Bedeutung haben, und daher für die Tech-Großkonzerne uninteressant sind.

Common Voice sammelt beispielsweise Sprachdaten in Hakha Chin, einer Sprache aus dem Westen Myanmars, die von nur etwa 200.000 Menschen gesprochen wird. In Kooperation mit der Deutschen Gesellschaft für Internationale Zusammenarbeit hat das Projekt auch den Aufbau eines Sprachkorpus in Kinyarwanda angestoßen. Die Sprache ist in Ruanda sowie angrenzenden Gebieten des Kongos und Uganda verbreitet und wird von etwa zwölf Millionen Menschen gesprochen.

Ebenfalls interessant:

Bitte beachte unsere Community-Richtlinien

Schreib den ersten Kommentar!

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.

Hey du! Schön, dass du hier bist. 😊

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team bestehend aus 65 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Danke für deine Unterstützung.

Digitales High Five,
Stephan Dörner (Chefredakteur t3n.de) & das gesamte t3n-Team

Anleitung zur Deaktivierung