Fundstück
KI-Hardware: Optischer Prozessor führt Supercomputer-Berechnungen mit einem Lichtstrahl aus

Der Energiehunger heutiger KI-Modelle ist eine massive Hürde. Ein neues Verfahren aus Finnland könnte das ändern, indem es Berechnungen nicht auf Chips, sondern in einem Lichtstrahl selbst durchführt.

Von Dieter Petereit
2 Min.
KI-Hardware: Optischer Prozessor führt Supercomputer-Berechnungen mit einem Lichtstrahl aus

Der Energiehunger von KI-Systemen erreicht kritische Grenzen. (Bild: Midjourney/t3n)

Forscher:innen der Aalto-Universität im finnischen Espoo haben eine Methode entwickelt, um komplexe KI-Berechnungen mit einem einzigen Lichtdurchgang auszuführen. Das Verfahren verspricht, die Effizienz von KI-Systemen dramatisch zu steigern und den enormen Stromverbrauch heutiger Hardware zu senken.

Die Ergebnisse wurden im renommierten Fachjournal Nature Photonics veröffentlicht.

Das Rechnen im Lichtstrahl

Moderne KI-Modelle, etwa für die Bild- oder Sprachverarbeitung, basieren auf sogenannten Tensoroperationen. Das sind im Grunde hochentwickelte, mehrdimensionale Matrix-Multiplikationen.

Bisher werden diese Operationen sequenziell, wenn auch hochgradig parallelisiert, von Grafikprozessoren (GPUs) bewältigt, was zu Engpässen und hohem Energiebedarf führt.

Das neue Verfahren, von den Forschern Dr. Yufeng Zhang und Prof. Zhipei Sun „Parallel Optical Matrix-Matrix Multiplication“ (POMMM) getauft, kodiert die digitalen Daten stattdessen direkt in die Amplitude (Helligkeit) und die Phase (Schwingungszustand) von kohärentem Licht.

Der eigentliche Rechenvorgang geschieht dann passiv, während das Licht ein optisches System durchquert. „Unsere Methode führt die gleichen Arten von Operationen durch, die heutige GPUs bewältigen, etwa Konvolutionen und Attention-Layer, aber sie erledigt sie alle mit Lichtgeschwindigkeit“, erklärt Dr. Zhang in einer Mitteilung der Aalto-Universität.

Damit die vielen parallelen Berechnungen sich nicht gegenseitig stören, nutzt das Team einen Trick mittels Fourier-Transformation: Jede Datenzeile erhält einen einzigartigen Phasengradienten, quasi einen optischen „Code“. Am Ende werden die Ergebnisse dadurch sauber in der Ortsfrequenzverteilung getrennt und können störungsfrei ausgelesen werden.

Vom Prototyp zur Anwendung

Das Team hat bereits einen optischen Prototyp konstruiert, der die hohe Übereinstimmung mit GPU-basierten Berechnungen belegt. Die Forscher:innen demonstrierten die Funktion erfolgreich an gängigen KI-Architekturen wie Convolutional Neural Networks (CNNs) und Vision Transformern (ViTs).

Durch die zusätzliche Nutzung verschiedener Licht-Wellenlängen (Wellenlängenmultiplexing) könnte das System theoretisch sogar Tensoroperationen noch höherer Ordnung verarbeiten.

Die Hürden der Photonik

Trotz des vielversprechenden Ansatzes ist der Weg zur Marktreife nicht trivial. Das Verfahren ist zwar passiv, erfordert aber eine zusätzliche Phasenmodulation, die, wie die Autoren im Nature-Paper selbst anmerken, die Integration und Kaskadierung in komplexen Systemen erschweren könnte.

Dies könnte die praktische Leistung in bestimmten reinen Bildverarbeitungs-Aufgaben (Vision-Tasks) im Vergleich zu anderen Photonik-Ansätzen limitieren.

Der aktuelle Prototyp, der aus Standard-Labor-Komponenten besteht, erreicht zudem noch keine disruptive Energieeffizienz. Das Potenzial der Methode entfaltet sich erst bei der Integration in dedizierte, massiv skalierte photonische Chips.

Die Forscher schätzen den Zeithorizont für eine mögliche Integration in Hardware-Plattformen großer Technologieunternehmen auf drei bis fünf Jahre.

Sollte die Skalierung gelingen, könnte POMMM eine neue Generation optischer Computersysteme begründen, die KI-Aufgaben mit extrem niedrigem Energieverbrauch beschleunigen.

