OpenAIs neues Ziel: KI-Modell soll Proteine finden – damit wir länger leben

OpenAI-Chef Sam Altman (Foto: jamesonwu1972 / Shutterstock.com).
Wer an die jüngsten KI-Beiträge im Bereich der Wissenschaft denkt, dem fällt wahrscheinlich zunächst Alphafold ein, das Google-Deepmind-Programm zur Proteinfaltung, das seinem Schöpfer letztes Jahr den Nobelpreis einbrachte. Doch dabei soll es nicht bleiben. Jetzt will auch OpenAI in die harte Forschung einsteigen – und auch hier geht es um Proteine. Das Unternehmen hat ein Sprachmodell für die Entwicklung neuer Eiweiße entwickelt. Es soll Proteine „erträumen“, die normale Zellen in Stammzellen verwandeln können – und Menschen bei dieser Aufgabe mit Leichtigkeit schlagen.
Das Vorhaben ist das erste Modell von OpenAI, das sich auf biologische Daten konzentriert. Gleichzeitig ist es das erste Mal, dass OpenAI öffentlich behauptet, dass seine Modelle neue wissenschaftliche Ergebnisse liefern können. Damit ist es nur noch ein kleiner Schritt auf dem Weg zur Feststellung, dass KI echte Entdeckungen machen kann – was nach Ansicht mancher Beobachter:innen ein wichtiger Test auf dem Weg zur sogenannten Allgemeinen Künstlichen Intelligenz (AGI) ist.
Zusammenarbeit mit Firma, die an Lebensverlängerung forscht
Im Januar sagte der CEO von OpenAI, Sam Altman, er sei „zuversichtlich“, dass sein Unternehmen bereits wisse, wie man eine AGI bauen könne, und fügte hinzu, dass „superintelligente Werkzeuge wissenschaftliche Entdeckungen und Innovationen massiv beschleunigen könnten“ – und zwar weit über das hinaus, wozu wir allein in der Lage sind. Das Protein-Engineering-Projekt begann vor einem Jahr, als Retro Biosciences, ein Unternehmen für Langlebigkeitsforschung mit Sitz in San Francisco, an OpenAI herantrat, um eine Zusammenarbeit zu vereinbaren.
Diese Verbindung kam nicht zufällig zustande. Altman selbst finanzierte Retro aus seiner persönlichen Schatulle mit 180 Millionen US-Dollar, wie MIT Technology Review erstmals 2023 berichtete. Retro hat das Ziel, die normale menschliche Lebensspanne um mindestens zehn Jahre zu verlängern. Zu diesem Zweck untersucht es die sogenannten Yamanaka-Faktoren. Dabei handelt es sich um eine Reihe von Proteinen, die, wenn sie einer menschlichen Hautzelle hinzugefügt werden, diese dazu veranlassen, sich in eine jung aussehende Stammzelle zu verwandeln. Diese soll dann jedes andere Gewebe im Körper produzieren können.
Langlebigkeit durch Reprogrammierung von Zellen
Das Phänomen wird von den Forschern von Retro und anderen gut finanzierten Unternehmen wie Altos Labs als möglicher Ausgangspunkt für die Verjüngung zunächst von Nutztieren, den Bau menschlicher Organe oder die Bereitstellung anderer Ersatzzellen angesehen. Eine solche „Reprogrammierung“ von Zellen ist jedoch nicht sehr effizient. Sie dauert mehrere Wochen, und weniger als ein Prozent der in einer Laborschale behandelten Zellen beenden die Verjüngungsreise wirklich.
Das neue Modell von OpenAI mit der Bezeichnung GPT-4b micro wurde nun so trainiert, dass es Vorschläge zur Umgestaltung der Proteinfaktoren macht, um deren Funktion zu verbessern. Nach Angaben von OpenAI nutzten die Forscher die Vorschläge des Modells, um zwei der Yamanaka-Faktoren so zu verändern, dass sie mehr als 50 Mal so effektiv sind – zumindest nach ersten vorläufigen Messungen.
„Im Großen und Ganzen scheinen die Proteine besser zu sein als das, was die Wissenschaftler selbst herstellen konnten“, sagt John Hallman, OpenAI-Forscher. Hallman und sein Kollege Aaron Jaech sowie Rico Meinl von Retro waren die Hauptentwickler des Modells. Außenstehende Wissenschaftler können aber erst nach der Veröffentlichung der Ergebnisse feststellen, ob diese wirklich realistisch sind, was nach Angaben der Unternehmen geplant ist. Auch ist das Modell noch nicht für eine breitere Nutzung verfügbar – es handelt sich noch um einen maßgeschneiderten Demonstrator und nicht um eine offizielle Produkteinführung.
„Das Projekt soll zeigen, dass es uns ernst damit ist, einen Beitrag zur Wissenschaft zu leisten“, sagt Jaech. „Aber ob diese Fähigkeiten als separates Modell auf den Markt kommen oder ob sie in unsere Hauptmodelle integriert werden – das muss noch entschieden werden.“ Das Modell funktioniert nicht auf die Weise wie Alphafold von Google, das vorhersagt, welche Form Proteine annehmen werden. Da es sich bei den Yamanaka-Faktoren um ungewöhnlich schlaffe und unstrukturierte Proteine handele, so OpenAI, sei ein anderer Ansatz erforderlich, für den die großen Sprachmodelle geeigneter seien.
Breite Trainingsdaten vieler Spezies
Das Modell wurde anhand von Beispielen von Proteinsequenzen aus vielen Spezies trainiert, sowie anhand von Informationen darüber, welche Proteine dazu neigen, miteinander zu interagieren. Das sind zwar große Datenmengen, aber nur ein Bruchteil dessen, womit OpenAIs Vorzeige-Chatbots trainiert wurden, was GPT-4b micro zu einem Beispiel für ein „kleines Sprachmodell“ macht, das mit einem gezielt ausgewählten Datensatz arbeitet.
Nachdem die Retro-Wissenschaftler das Modell erhalten hatten, versuchten sie zunächst, es so zu steuern, dass es mögliche Umgestaltungsvorschläge für die Yamanaka-Proteine machte. Die Taktik des Promptings ähnelte dabei der „few-shot“-Methode, bei der ein Benutzer einen Chatbot instruiert, indem er eine Reihe von Beispielen mit Antworten vorgibt, gefolgt von einem Beispiel, auf das der Bot reagieren soll.
Ein Protein kann auf unendliche Weise verändert werden
Obwohl Gentechniker:innen über Möglichkeiten verfügen, die Evolution von Molekülen im Labor zu steuern, können sie in der Regel nur eine bestimmte Anzahl von Möglichkeiten testen. Und selbst ein Protein von typischer Länge kann auf nahezu unendliche Weise verändert werden (da es aus Hunderten von Aminosäuren aufgebaut ist und jede Säure in 20 möglichen Varianten vorliegt). Das Modell von OpenAI spuckt jedoch oft Vorschläge aus, bei denen ein Drittel der Aminosäuren in den Proteinen verändert wurde.
„Wir haben dieses Modell sofort im Labor eingesetzt und bekamen echte Ergebnisse“, sagt Joe Betts-Lacroix, CEO von Retro. Er glaube, dass die Ideen des Modells ungewöhnlich gut sind und in einem erheblichen Teil der Fälle zu Verbesserungen gegenüber den ursprünglichen Yamanaka-Faktoren führten. Vadim Gladyshev, Altersforscher an der Harvard University, der Retro berät, meint, dass bessere Methoden zur Herstellung von Stammzellen erforderlich sind. „Für uns wäre das äußerst nützlich. Hautzellen lassen sich leicht umprogrammieren, andere Zellen jedoch nicht“, sagt er. Wenn man es bei einer neuen Spezies probiere, sei das oft extrem anders, und man bekomme nichts heraus.
Verhalten des Modells verstehen
Wie genau GPT-4b zu seinen Mutmaßungen kommt, ist noch unklar – wie es bei KI-Modellen oft der Fall ist. „Es ist wie bei Alphago, das den besten Menschen beim Go besiegt hat, aber es hat lange gedauert, bis wir herausgefunden haben, warum“, sagt Betts-Lacroix. „Wir sind immer noch dabei zu verstehen, was das neue Modell genau tut, und wir denken, dass die Art und Weise, wie wir es anwenden, nur an der Oberfläche kratzt.“
Laut OpenAI floss im Rahmen der Zusammenarbeit kein Geld. Aber da die Arbeit Retro zugutekommen könnte – dessen größter Investor wie erwähnt Altman ist –, könnte die Kooperation Kritik verstärken, die um die Nebenprojekte des OpenAI-CEOs kreisen.
Altmans Investitionen in private Tech-Startups
Letztes Jahr schrieb das Wall Street Journal, dass Altmans weitreichende Investitionen in private Tech-Startups einem „undurchsichtigen Investmentimperium“ gleichkämen, das eine wachsende Anzahl potenzieller Konflikte erzeuge, da einige dieser Unternehmen auch mit OpenAI zusammenarbeiten.
Im Fall von Retro könnte allein die Verbindung zu Altman, OpenAI und dem Wettlauf in Richtung AGI das Profil des Unternehmens schärfen und seine Fähigkeit verbessern, Mitarbeiter einzustellen und Gelder einzuwerben. Betts-Lacroix beantwortete keine Fragen dazu, ob sich das Unternehmen, das sich noch in der Anfangsphase befindet, derzeit im Fundraising-Modus befindet. OpenAI wiederum betont, dass Altman nicht direkt in die Arbeit involviert sei und das Unternehmen niemals Entscheidungen auf der Grundlage von Altmans anderen Investitionen treffe.