Tippfehler und Verschreiber gehören zum Alltag wie, naja, die Löschen-Taste auf der Tastatur oder dem Smartphone vielleicht. Und zum Glück wissen unsere Mitmenschen in der Regel ja auch, was wir meinen, wenn wir erzählen, dass unsere Kollegin vor Kurzem einen „Hudn“ adoptiert hat. Aber woher weiß ein maschinelles Gegenüber wie Googles Suchmaske, was wir meinen?
Google unterscheidet 2 Arten von Fehlern
In einem Blogbeitrag hat Googles Vice President Search, Pandu Nayak, jetzt erklärt, wie die Suchmaschine mit Begriffen umgeht, die Fehler beinhalten – und warum sie uns in der Regel trotzdem sinnvolle und passende Ergebnisse ausspielt.
Zunächst, so Nayak, sei zu unterscheiden zwischen zwei Arten von Eingabefehlern. Zum einen gibt es die, bei denen Nutzerinnen und Nutzer die korrekte Schreibweise nicht kennen und sogenannte konzeptuelle Fehler machen. Als Beispiel nennt er das englische Wort „gobbledygook“, das so viel wie „Kauderwelsch“ bedeutet. Userinnen und User wissen bei solchen Begriffen in der Regel, wie sie ausgesprochen werden, und versuchen, die richtige Schreibweise abzuleiten – dabei kann dann auch „gobblydegook“ oder „gobbly gook“ herauskommen.
Die zweite Art Fehler passieren, wenn wir uns schlicht vertippen oder auf der Tastatur verrutschen – der bereits genannte „Hudn“ kommt so zustande. Das ist auch der Grund, warum Google über 10.000 Varianten von „Youtube“ kennt, darunter „You7ube“ oder „Ytoube“.
Der Suchalgorithmus lernt beständig dazu
Trotzdem sieht sich natürlich auch Google mit Eingabefehlern konfrontiert, die so noch nie vorgekommen sind. In diesem Fall, so Nayak, habe das System hinter der Suchmaschine früher mit dem Tastatur-Layout gearbeitet. Ergab eine Eingabe keinen Sinn, war der erste Schritt immer, Buchstabenkombinationen mit den umliegenden Tasten zu checken – die Wahrscheinlichkeit ist schließlich recht hoch, dass der eingegebene „Hznd“ einfach ein verrutschter „Hund“ ist – die „Hand“ ist eher unwahrscheinlich, weil u und a zu weit voneinander entfernt sind.
Inzwischen setzt Google auch hier selbstlernende Algorithmen ein, erklärt Nayak weiter. Das neuronale Netz, das seit letztem Jahr im Einsatz ist, lerne auch von einzigartigen und seltenen Eingabefehlern. In weniger als zwei Millisekunden würden mehr als 680 Millionen Parameter abgefragt – so könne die Suchmaschine selbst für kryptische Eingaben schnell ein Ergebnis – oder Vorschläge – ausspielen.
Nicht zuletzt spielt auch der Kontext eine wichtige Rolle. Menschen suchen verhältnismäßig oft nicht nur nach einem Wort, sondern kombinieren mehrere. So könne die Suchmaschine aus den einzelnen Bestandteilen der Eingabe „average home coast“ herauslesen, dass die Intention dahinter wohl eher „average home cost“ ist – und nichts mit der Küste zu tun hat.
Finde ich gut zusammengefasst, sollte aber Berücksichtigen, das wir hier den Qualitätsfaktor nicht vernachlässigen sollten! Klar kann eine Suchmaschine entsprechende Tippfehler korrigieren, doch diese sind immer noch „falsch“ und der Leser wird mit der „Wahrheit“ entsprechend konfrontiert. Hier wiederum wird der User einen Indikator für ein Absprung verhalten vor die Nase gelegt. Ob dies sinnvoll ist? Nun ich denke das wir uns zwar dankbar zeigen können, dass eine Suchmaschine entsprechende Unterstützung zukommen lässt. Doch aus der Erfahrung wechseln „Return Visitors“ für besseren Mehrwert gerne zur Konkurrenz.