Googles Deepmind-Forscher gewinnen Nobelpreis für Chemie: Was kann Alphafold 3?
Mit Alphafold 3 hat Google Deepmind, dessen Forscher Hassabis und Jumper nun den Nobelpreis für Chemie gewonnen haben, im vergangenen Frühjahr eine verbesserte Version seines KI-Biologie-Tools veröffentlicht. Damit ist es möglich, nicht nur die Strukturen von Proteinen, sondern von fast allen Elementen des biologischen Lebens vorherzusagen. Dabei geht es um die Strukturen von DNA, RNA und anderen Molekülen, wie Liganden. Das Tool liefere ein nuancierteres und dynamischeres Bild der Molekülinteraktionen als alles bisher Dagewesene, heißt es von Deepmind. Das Tool wird derzeit für Experimente in einer großen Bandbreite eingesetzt: von der Identifizierung von widerstandsfähigen Nutzpflanzen bis hin zu neuen Impfstoffen.
Dass Deepmind so große Erwartungen an Alphafold knüpft, kommt nicht von ungefähr: 2020 hatte das KI-Werkzeug in einem internationalen Wettbewerb zur Berechnung von Proteinstrukturen gewonnen, indem es 70 der im Wettbewerb zu lösenden 100 Proteinsequenzen so präzise vorhersagte wie Experimentatoren auf Basis experimenteller Verfahren. Daher herrschte die Überzeugung vor, dass Alphafold mehr als nur Proteine verarbeiten kann.
Eigenschaften der Biologie modellieren
„Die Biologie ist ein dynamisches System“, sagte Deepmind-CEO Demis Hassabis in einer Telefonkonferenz. „Die Eigenschaften der Biologie entstehen durch die Wechselwirkungen zwischen verschiedenen Molekülen in der Zelle, und man kann Alphafold 3 als unseren ersten großen Schritt in Richtung [Modellierung] dieser Eigenschaften betrachten.“
Alphafold 2 hatte geholfen, das menschliche Herz besser zu kartieren, Antibiotikaresistenzen zu modellieren und die Eier von ausgestorbenen Vögeln zu identifizieren.
Mohammed AlQuraishi, ein Assistenzprofessor für Systembiologie an der Columbia University, der nicht mit Deepmind verbunden ist, glaubt, dass die neue Version des Modells sogar noch besser für die Entdeckung von Medikamenten sein wird. „Das Alphafold 2-System kannte nur Aminosäuren, sodass es für die Biopharmazie nur von sehr begrenztem Nutzen war“, sagt er. „Aber jetzt kann das System im Prinzip vorhersagen, wo ein Medikament an ein Protein bindet.“
Isomorphic Labs, eine Ausgründung von Deepmind im Bereich der Arzneimittelforschung, nutzt das Modell bereits für genau diesen Zweck und arbeitet mit Pharmaunternehmen zusammen, um neue Behandlungsmethoden für Krankheiten zu entwickeln, so Deepmind.
Genauigkeit der Vorhersagen
AlQuraishi sagt, dass die neue Version einen großen Schritt nach vorn bedeutet. Dennoch gebe es auch Vorbehalte: „Das System wird dadurch viel allgemeiner, und insbesondere für die Arzneimittelentdeckung (in der Frühphase der Forschung) ist es jetzt viel nützlicher als Alphafold 2“, sagt er. Aber wie bei den meisten Modellen hängt die Wirkung von Alphafold davon ab, wie genau seine Vorhersagen sind. Bei einigen Anwendungen hat Alphafold 3 eine doppelt so hohe Erfolgsquote wie ähnliche führende Modelle wie Rosettafold. Aber für andere, wie Protein-RNA-Interaktionen, ist es laut AlQuraishi immer noch sehr ungenau.
Deepmind sagt, dass die Genauigkeit je nach modellierter Interaktion zwischen 40 Prozent und über 80 Prozent liegen kann. Zudem teilt das Modell den Forscher:innen mit, wie sicher es in seiner Vorhersage ist. Bei weniger genauen Vorhersagen müssen die Forscher:innen Alphafold lediglich als Ausgangspunkt verwenden, bevor sie andere Methoden anwenden. Ungeachtet dieser Genauigkeitsspannen ist es für Wissenschaftler:innen, die versuchen, erste Schritte zur Beantwortung einer Frage zu unternehmen, zum Beispiel welche Enzyme das Potenzial haben, das Plastik in Wasserflaschen abzubauen, wesentlich effizienter, ein Werkzeug wie Alphafold zu verwenden als experimentelle Techniken wie die Röntgenkristallografie.
Die größere Molekülbibliothek und die höhere Komplexität von Alphafold 3 erforderten Verbesserungen an der zugrunde liegenden Modellarchitektur. Deepmind wandte sich daher den Diffusionstechniken zu, die KI-Forscher in den letzten Jahren stetig verbessert haben und die jetzt Bild- und Videogeneratoren wie Dall-E 2 und Sora von OpenAI antreiben. Dabei wird ein Modell so trainiert, dass es mit einem verrauschten Bild beginnt und dann das Rauschen Stück für Stück reduziert, bis eine genaue Vorhersage entsteht. Diese Methode ermöglicht es Alphafold 3, eine viel größere Anzahl von Eingaben zu verarbeiten.
„Das war eine große Entwicklung gegenüber dem Vorgängermodell“, so John Jumper, Direktor bei Google Deepmind. „Es hat den gesamten Prozess der Zusammenarbeit all dieser verschiedenen Atome wirklich vereinfacht.“
Risiko wie Halluzinieren
Es birgt aber auch neue Risiken. Wie im Alphafold 3-Paper beschrieben, konnte das Modell durch die Verwendung von Diffusionstechniken halluzinieren oder Strukturen erzeugen, die zwar plausibel aussehen, aber in Wirklichkeit nicht existieren können. Die Forschenden verringerten dieses Risiko, indem sie mehr Trainingsdaten zu den Bereichen hinzufügten, die am anfälligsten für Halluzinationen sind. Aber auch das beseitigte das Problem nicht vollständig.
Welchen Einfluss Alphafold 3 auf die Medikamententwicklung haben wird, wird teils davon abhängen, wie Deepmind den Zugang zu dem Modell aufteilt. Bei Alphafold 2 veröffentlichte das Unternehmen den Open-Source-Code, sodass Forscher ins Innere schauen konnten, um ein besseres Verständnis der Funktionsweise zu erlangen. Er war auch für alle Zwecke verfügbar, einschließlich der kommerziellen Nutzung durch Arzneimittelhersteller.
Für Alphafold 3, so Hassabis, gibt es derzeit keine Pläne, den vollständigen Code zu veröffentlichen. Stattdessen teilt das Unternehmen eine öffentliche Schnittstelle für das Modell, den so genannten Alphafold Server, der die Moleküle einschränkt, mit denen experimentiert werden kann, und der nur für nichtkommerzielle Zwecke verwendet werden kann. Laut Deepmind soll die Schnittstelle die technische Hürde senken und die Nutzung des Tools auf Biolog:innen ausweiten, die mit dieser Technologie weniger vertraut sind.
Die neuen Einschränkungen sind laut AlQuraishi von großer Bedeutung. „Das wichtigste Verkaufsargument des Systems – seine Fähigkeit, Wechselwirkungen zwischen Proteinen und kleinen Molekülen vorherzusagen – ist für die Öffentlichkeit im Grunde nicht verfügbar“, sagt er. „Im Moment ist es vor allem ein Lockmittel.“