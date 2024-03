Die Idee scheint völlig logisch. Schon jetzt ist es so, dass die meisten modernen Computer, von Smartphones und PCs bis zu Servern in Rechenzentren, Grafikprozessoren (GPU) und Hardwarebeschleuniger für KI und maschinelles Lernen enthalten. Das trifft etwa auf die Tensor Cores auf Nvidia-GPU, die Tensor Processing Units (TPU) auf Google-Cloud-Servern, die Neural Engines auf Apple iPhones oder die Edge TPU auf Google-Pixel-Telefonen zu.

Einfache Idee: Alle Prozessoreinheiten arbeiten gleichzeitig

Bislang verarbeitet jede dieser Komponenten Informationen separat. Dabei werden die Informationen dann von einer Verarbeitungseinheit zur nächsten geleitet. Diese Stapelverarbeitung ist natürlich der Engpass im Datenfluss, weil die nicht aktiven Komponenten während der Verarbeitung durch eine andere Prozessoreinheit weitestgehend im Leerlauf bleiben.

In einer neuen Studie zeigen Forscher:innen an der US-amerikanischen University of California Riverside (UCR) eine Methode, bei der die verschiedenen Komponenten gleichzeitig arbeiten. So könne die Verarbeitungsgeschwindigkeit erheblich erhöht und zudem der Energieverbrauch gesenkt werden.

„Man muss keine neuen Prozessoren hinzufügen, weil sie bereits vorhanden sind“, so Studienmitautor Hung-Wei Tseng, außerordentlicher Professor für Elektro- und Computertechnik an der UCR. Ihr neues System bezeichnen die Forscher:innen als simultanes und heterogenes Multithreading (SHMT).

Standardkomponenten mit neuem Software-Antrieb

SHMT nutzt mehrere Komponenten, indem es die zu erledigenden Rechenfunktionen unter ihnen aufteilt und so eine Parallelverarbeitung einführt. Um ihr Konzept zu testen, bauten die Forscher:innen ein System mit der Art von Chips und Verarbeitungsleistung, wie sie in jedem neueren Smartphone zu finden sind. Später nahmen sie einige Änderungen vor, um die Tauglichkeit des Ansatzes in Rechenzentren zu testen.

Dabei verwendeten sie Standardkomponenten, die sie über die integrierte PCIe-Schnittstelle miteinander verbanden. Getestet wurde unter Ubuntu Linux 18.04. Für die Tests wurden Benchmark-Apps verwendet, was die Aussage über die Alltagstauglichkeit etwas einschränkt.

Jedenfalls zeigt sich bei dieser Art Tests, dass das Software-Framework einen bis zu 1,95-fachen Geschwindigkeitszuwachs und eine Senkung des Energieverbrauchs um 51 Prozent im Vergleich zur unmodifizierten Vorgehensweise brachte. Das könnte deutliche Auswirkungen auf den Markt haben, glauben die UCR-Forscher:innen.

Schnellere, billigere und stromsparende Produkte könnten die Folge sein

Zum einen könnten bestehende Produkte eine immense Leistungssteigerung erzielen, zum anderen könnte das Konzept aber auch genutzt werden, um gleiche Leistungen wie bisher mit wesentlich günstigeren Komponenten zu erzielen. In Rechenzentren könnte auch der Aspekt des reduzierten Energieverbrauchs eine große Rolle spielen, weil so die Kohlenstoffemissionen und der Wasserverbrauch gesenkt werden könnten.

Das Produkt ist noch nicht marktreif und benötigt weitere Forschung. Ihre Erkenntnisse haben die Forscher:innen auf der Micro 2023 Anfang November 2023 im kanadischen Toronto vorgestellt.

