KI besteht Turing-Test: Darum ist der Hype unbegründet [Kommentar]
Was ist der Turing-Test
Der legendäre Test wurde vom Kryptoanalytiker, Informatiker und einem der wohl wichtigsten Theoretiker in der IT, Alan Turing, geschaffen, um zu testen ob eine Maschine, ein dem Menschen gleichwertiges Verhalten haben kann beziehungsweise in der Lage ist zu „denken“. Dabei muss ein Computerprogramm den Tester überzeugen, dass es selbst menschlich ist.
Dabei werden dem Tester zwei Partner gegenübergestellt – ein Programm und ein Mensch. Beide versuchen den Tester über einen Text-Chat davon zu überzeugen, dass sie denken können. Wobei das laut Auffassung von Turing dann der Fall ist, wenn das Programm als Mensch wahrgenommen wird. Wenn der Tester innerhalb von fünf Minuten überzeugt werden kann, und das insgesamt 30 Prozent der Tester ebenfalls, dann gilt der Turing-Test als bestanden – und das ist jetzt erstmalig der Fall.
Der Gewinner ist ein 13-jähriger Ukrainer
Eugen Goostman heißt das Programm, das in der Lage ist, 33 Prozent der Probanden zu täuschen, indem es sich als 13-jähriger ukrainischer Schüler aus Odessa ausgibt. Eugen ist Eminem-Fan und besitzt ein Meerschweinchen und wird seit 2001 entwickelt. Die zwei Entwickler Vladimir Veselov und Eugene Demchenko haben laut eigener Aussage darauf Wert gelegt, dass Eugene einen Charakter besitzt und nicht einfach nur stupide Fragen beantwortet – oder zumindest vorgibt Charakter zu haben, denn in einem Text-Chat ist so ziemlich alles eine Frage. Auf der offiziellen Website könnt ihr selbst mit dem Turing-Test-Gewinner Eugen Goostman chatten.
Innerhalb von fünf Minuten erweckt das Programm durchaus den Eindruck, dass man sich mit einem echten Kind unterhält – allerdings ist spätestens die zweite Frage nach dem Heimatort oder dem Arbeitsplatz verdächtig.
Turing-Test bestanden: Aber was bedeutet das?
Sind wir jetzt der Apokalypse durch Terminatoren oder Screamers nähergekommen? Nicht wirklich, denn der Turing-Test weist auch einige Schwachstellen auf, weshalb nicht jedes Programm, dass den Turing-Test besteht, gleich ein H.A.L 9000 ist.
Der Turing-Test misst nämlich nicht wirklich die Intelligenz an sich oder die Lernfähigkeit von Programmen, sondern „nur“ einen Teil davon – das menschliche Verhalten, Und da kommen wir zu einem Problem: Alle Menschen, die in dem Test als Tester fungieren, sind unterschiedlich. Menschen mit psychischen Problemen können den Turing-Test erst gar nicht bestehen – obwohl sie intelligent sind. Das liegt daran, dass Turing menschliches Verhalten mit Intelligenz gleichsetzt. Das führt auch zum Argument, dass der Test nicht standardisiert werden kann, da Menschen unterschiedlich sind und dementsprechend auch die Testparameter für die zu testenden Programme.
Der Test mit dem Programm Eugen Gootsman ist zwar ein Schritt vorwärts, allerdings bietet der „Charakter“ eines 13-jährigen auch den Vorteil „einiges, aber eben nicht alles zu wissen, was in einer gewissen Nachsicht resultiert“ – so Veselov.
Fazit
Turing hat im Jahre 1950 vermutet, dass der durschnittliche Anwender im Jahr 2000 eine höchstens 70-prozentige Chance haben wird, Mensch und Maschine erfolgreich zu identifizieren beziehungsweise zu unterscheiden. Eugene Goostman hat 33 Prozent erreicht, es bleibt also noch ein gutes Stück zu gehen.
Vielleicht wird Eugene in Zukunft Chat-Engines wie zum Beispiel Eliza ablösen und uns als ein IKEA-Schnupperschüler im Chat begegnen. Oder er wird uns helfen, unsere Internetprobleme über Telefon zu lösen oder neue Tarifverträge abzuschließen – zu mehr wird es nicht reichen. Dieser Erfolg zeigt uns aber, wie viel wir eigentlich noch zu lernen haben und das dieser erste Erfolg dann doch nicht so groß ist, wie er gerade gefeiert wird – gerade vor dem Hintergrund, dass die Tester von einem 13-jährigen Schüler ausgegangen sind.
Ich habe direkt nach der 2. Frage gemerkt, dass es sich nicht um ein 13-jähriges Kind handeln kann…solche Antworten sind einfach höchst unwahrscheinlich von einem 13-Jährigen zu hören, was soll das?
Hallo Ahmed! Welche Frage war das denn?
Hm, da geht ein bisschen was durcheinander in dem Text. Gerade der erste Absatz des Fazit wirft falsches zusammen: Die 70-Prozent-Chance für den durchschnittlichen Anwender (Mensch) ist korrekt. Goostman hat aber nicht 33 Prozent statt der 70 erreicht (ist ja auch kein Mensch), sondern er bedient als Maschine die zu den 100 Prozent fehlenden 30 Prozent. Da er 33 erreicht hat, liegt Turing mit seiner Annahme richtig: heute gelingt es Menschen nur noch zu 70 (67) Prozent Sicherheit, einen Menschen von einer Maschine zu unterscheiden.
Nicht ganz unwichtig wäre auch zu erwähnen, dass man auf der angegebenen Seite mit einer älteren Version von Eugene Goostman chatten kann – nicht jene, die den Test abgelegt hat. Der Name des Programms wird im Artikel übrigens auch permanent falsch geschrieben. ^^
Aber nicht falsch verstehen: schöner Kommentar insgesamt.
Der Server ist im Moment „Down“. Das passiert bei einem 13jährigen selten.