Wie funktionieren große Sprachmodelle? Diese interaktive Website erklärt es euch
Etwas mehr als ein Jahr ist es jetzt her, dass OpenAI ChatGPT veröffentlicht hat. Durch den enormen Erfolg des KI-Chatbots weiß heute jeder technisch interessierte Mensch, was große Sprachmodelle zu leisten vermögen. Wie das Ganze aus technischer Sicht funktioniert, dürften hingegen deutlich weniger Menschen wissen.
In Anbetracht der Tatsache, das große Sprachmodelle in immer mehr Lebensbereichen zum Einsatz kommen, wäre es durchaus sinnvoll, diese Wissenslücke zu stopfen. Das dachte sich wohl auch der neuseeländische Softwareentwickler Brendan Bycroft, der eine äußerst lehrreiche interaktive Grafik geschaffen hat, die euch die Funktionsweise großer Sprachmodelle näherbringt.
Große Sprachmodelle verstehen
Bycrofts LLM Visualization erklärt jeden einzelnen Schritt, den ein großes Sprachmodell durchläuft. Neben einer Erklärung in englischer Sprache auf der linken Bildschirmseite gibt es dazu auch eine grafische Repräsentation. Durch Drücken der Leertaste bewegt ihr euch durch die Erklärung, die euch durch die Kombination von Text und Animationen ein verständliches Bild der Funktionsweise großer Sprachmodelle vermittelt.
Besonders praktisch: Fahrt ihr mit dem Cursor über ein grafisches Element, wird dessen Bezeichnung im Text durch eine Markierung hervorgehoben. So könnt ihr im Zweifel sicherstellen, von welchem Mechanismus an welcher Stelle die Rede ist.
Wer verstehen will, wie große Sprachmodelle arbeiten, der sollte unbedingt einen Blick auf Bycrofts grafische Erklärung werfen. Einziger Wermutstropfen: Die Anleitung ist nur auf Englisch verfügbar.