
Die Computerbiologie steht vor einem grundlegenden Problem. Die Ausrichtung von Protein- und DNA-Sequenzen für den Zusammenbau von Genomen ist ein sehr rechenintensiver Prozess.
GPU zu ineffizient bei der Genomsequenzierung
Deswegen hat sich über die vergangenen zehn Jahre vor allem der Einsatz von Grafikprozessoren (GPU) in der Wissenschaft etabliert. GPU sind ursprünglich zur Beschleunigung des Grafik-Renderings in Videospielen entwickelt worden.
Mit steigender Komplexität der Forschung zeigt sich indes, dass die Geschwindigkeit der GPU auf Dauer nicht zufriedenstellend ist. „Das Sequenzalignment ist ein extrem wichtiger und rechenintensiver Teil jeder biologischen Rechenaufgabe“, erläutert Giulia Guidi, Assistenzprofessorin für Informatik an der Cornell-Universität im US-amerikanischen New York. „Sie ist extrem häufig und stellt normalerweise einen der Engpässe bei der Berechnung dar.“
Unzufrieden mit den GPU-Ergebnissen, leitete Guidi eine Studie, die die Leistung einer sogenannten Intelligence Processing Unit (IPU) anhand vorhandener DNA- und Proteinsequenzdaten testen sollte. IPU gehören zu den für KI-Anwendungen essenziellen Chips, da sie gezielt für die dort anfallenden Berechnungsaufgaben ersonnen wurden.
IPU beschleunigt Sequenzierung um den Faktor 10
Wie Guidis Team feststellen konnte, beschleunigt die IPU ebenso den Ausrichtungsprozess von Molekülen – vor allem, weil sie auf dem Gerät mehr Speicher zur Verfügung stellt, der den Datendurchlauf beschleunigt.
Eben weil sie über eine große Bandbreite für die Datenübertragung auf dem Gerät verfügen und ungleichmäßige und unvorhersehbare Arbeitslasten bewältigen können, hatte sich Guidis Team für die IPU interessiert. Denn X‑Drop, ein gängiger Algorithmus zum Abgleichen von Sequenzen, hat ein sehr unregelmäßiges Berechnungsmuster.
Wenn zwei Sequenzen übereinstimmen, benötigt der Algorithmus viele Berechnungen, um die richtige Ausrichtung zu bestimmen. Stimmen sie nicht überein, stoppt der Algorithmus einfach. Grafikprozessoren haben nach Guidis Erkenntnissen mit dieser Art von unregelmäßigen Berechnungen zu kämpfen. Wie sich herausstellte, haben IPU dieses Problem nicht.
„Der Bedarf an groß angelegten Berechnungen wächst in vielen Bereichen der Wissenschaft, da wir heute viel besser als je zuvor in der Lage sind, Daten zu erzeugen“, so Guidi. „Paralleles Rechnen ist nicht mehr nur ein Luxus, sondern ein unverzichtbares Gut.“
Ebendiese Art von Berechnungen unterstützen IPU nach ihren Erkenntnissen besser als die bisher eingesetzten GPU. Bis zum Faktor 10 konnte die Leistung gesteigert werden.
Optimierungsbedarf gibt es weiterhin
Einen Wermutstropfen gibt es aber noch. Zwar sind die Berechnungsprozesse auf der IPU schnell, es gibt allerdings weiterhin den Flaschenhals des Zusammenspiels zwischen CPU und IPU. Ebenso sei das Software-Ökosystem noch nicht optimiert, wie Guidi erläutert.
„Man kann die hohe Speicherbandbreite der IPU ausnutzen und so die gesamte Verarbeitung beschleunigen“, sagt die Professorin. „Die IPU könnte die nächste GPU werden.“
Die Studie steht auf dem Arxiv-Preprint-Server zur Verfügung.