News

Für freie Siri-Alternativen: Mozilla veröffentlicht riesigen Satz an Sprachdaten

(Foto: Shutterstock)

Mozilla hat nicht nur eine quelloffene Spracherkennungssoftware veröffentlicht, sondern auch ein umfangreiches Set an lizenzfreien Trainingsdaten. Kommt jetzt Bewegung in den von Großkonzernen dominierten Bereich?

Common Voice: Mozilla veröffentlicht freie Trainingsdaten für Spracherkennungsmodelle

Google, Amazon, Microsoft und Apple: Alle großen Tech-Konzerne haben eigene Spracherkennungslösungen entwickelt und bieten sie zumindest teilweise über ihre Cloud-Dienste auch zur Integration in Drittanbieterlösungen an. An konkurrenzfähigen Open-Source-Alternativen mangelt es allerdings. Dabei sind die grundlegenden Techniken dahinter in Form wissenschaftlicher Paper durchaus dokumentiert. Nur bringt auch das beste Spracherkennungsmodell erstmal wenig, wenn es nicht mit genug echten Sprachdaten trainiert werden kann.

Genau hier soll Mozillas Common-Voice-Projekt ins Spiel kommen: Hinter dem Namen verbirgt sich die derzeit zweitgrößte Sammlung frei verfügbarer Trainingsdaten. Die hat Mozilla jetzt unter einer freien Lizenz veröffentlicht, die Trainingsdaten können also für kommerzielle und nichtkommerzielle Zwecke verwendet werden. Über die Common-Voice-Website können interessierte Internet-Nutzer außerdem dabei helfen, den Bestand an Sprachdaten auszubauen, indem sie vorgefertigte Sätze ablesen, die dann ebenfalls in den Datenbestand integriert werden.

Zum jetzigen Zeitpunkt umfasst das Datenset insgesamt 500 Stunden an Sprachaufnahmen. Die setzen sich aus 400.000 Einzelaufnahmen zusammen, die wiederum von 200.000 unterschiedlichen Sprechern stammen. Je nach Interesse von freiwilligen Helfern könnte der Bestand aber natürlich noch deutlich anwachsen.

Quelloffene Spracherkennungssoftware von Mozilla

Gleichzeitig zu den Sprachdaten hat Mozilla auch eine quelloffene Spracherkennungssoftware auf Tensorflow-Basis veröffentlicht. Die setzt auf Deep Learning und basiert auf einem im Jahr 2014 von Forschern des chinesischen Internet-Riesen Baidu veröffentlichten Paper. Die Fehlerrate der Software liegt laut Mozilla derzeit bei 6,5 Prozent. Google hat im Mai 2017 erklärt, die Fehlerrate ihrer Spracherkennung läge mittlerweile knapp unter fünf Prozent. Allerdings ist unklar, welche Methode Google zur Bestimmung des Wertes eingesetzt hat. Ein Vergleich beider Angaben ist daher nur bedingt sinnvoll.

Die Software steht unter der Mozilla-Public-License 2.0 und kann auf Github heruntergeladen werden. Über die Entwickler-Plattform könnt ihr euch natürlich auch an der Weiterentwicklung beteiligen. Wer sich mit anderen Entwicklern über die Software austauschen möchte oder Fragen hat, die im offiziellen FAQ-Dokument nicht beantwortet werden, der kann das über das offizielle Discourse-Forum des Projekts tun.

Ebenfalls interessant:

Zur Startseite
Bitte beachte unsere Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Schreib den ersten Kommentar!

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.

Bitte schalte deinen Adblocker für t3n.de aus!

Hey du! Schön, dass du hier bist. 😊

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team bestehend aus 65 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Danke für deine Unterstützung.

Digitales High Five,
Stephan Dörner (Chefredakteur t3n.de) & das gesamte t3n-Team

Anleitung zur Deaktivierung