Proteinfaltung: Deepmind-Datenbank steht nun allen Menschen offen
Die Struktur von Proteinen, die elementaren Bausteine jedes Lebewesens, war für uns Menschen bislang ein Mysterium. Wenn Zellen Proteine herstellen, reihen sie unzählige Aminosäuren zu einer langen Kette, die sich irgendwann ineinander faltet. Diese Faltung ist für jedes Protein anders und sie bestimmt, wie die Proteine in einer Zelle arbeiten, ob sie gutmütig oder schädlich sind, ob die Zelle richtig arbeitet oder nicht.
Diese Entschlüsselung der Proteinfaltung galt lange als eine der größten Herausforderungen der Biologie. Bislang war es wenn dann nur in extrem mühsamer Kleinarbeit möglich, die Faltung einzelner Proteine zu modellieren und nachzuverfolgen. Doch vergangenes Jahr konnte ausgerechnet das KI-Startup Deepmind, das wie Google zum Alphabet-Konzern gehört, einen Durchbruch feiern – und will ihn jetzt mit der Welt teilen.
Unter dem Projekt Alphafold setzte Deepmind in den vergangenen Jahren eine künstliche Intelligenz auf Basis von maschinellem Lernen ein, um die Proteinstruktur basierend auf der individuellen Aminosäuresequenz vorherzusagen. Vergangenen November präsentierte das Startup erstmals seine gesammelten Ergebnisse, die selbst die kühnsten Erwartungen übertrafen: So war Alphafold in der Lage, in einem Gemeinschaftsexperiment von den 100 präsentierten Proteinsequenzen in 70 Fällen so präzise die Struktur vorhersagen, wie es bislang nur durch experimentelle Versuche möglich war. Wenn es um den Unterschied zwischen berechneter und tatsächlicher Struktur ging, kam Deepmind auf einen Durchschnittswert von über 90 – 100 ist das Maximum. Soll heißen: Die KI war verdammt nah dran an der tatsächlichen Faltung.
Nach dem Genom kommt das Proteom
Inzwischen gehen die Verantwortlichen davon aus, die Proteinfaltung von etwa 98,5 Prozent des menschlichen Proteoms, also der Gesamtheit aller Proteine im Organismus, so genau vorhergesagt zu haben, dass die Ergebnisse einen konkreten medizinischen und wissenschaftlichen Nutzen haben. Forscher:innen müssen nicht für jedes Protein bei Null starten, sondern können die vorhergesagte Faltung als Basis nehmen.
Die gesamte Protein-Datenbank, die Deepmind inzwischen angelegt hat, stellt das Startup nun der Welt zur Verfügung – und zwar als Open-Source. Dazu gehören fast alle der 20.000 von Menschen exprimierten Proteinen sowie Strukturen von rund 20 weiteren Organismen wie Hefebakterien und E.coli. Insgesamt umfasst die Datenbank rund 350.000 Proteine, was die Datenbank zu einer der größten und mutmaßlich besten macht, die es bislang gab. Außerdem gibt es ein Paper, in dem genau auf das Verfahren der zugrundeliegenden KI eingegangen wird.
Deepmind, das mit dem European Molecular Biology Laboratory zusammengearbeitet hat, hofft, dass die Datenbank Forschern helfen wird, zu analysieren, wie das Leben auf atomarer Ebene funktioniert. Sie sollen herausfinden, wie Krankheiten ausgelöst werden, wie Medikamente persönlich angepasst werden können und wie „grüne Enzyme“ vielleicht eines Tages Plastik abbauen können.
„Strukturbiologen sind noch nicht daran gewöhnt, dass sie alles in Sekundenschnelle nachschlagen können, da sie bislang Jahre gebraucht haben, um diese Dinge experimentell zu bestimmen“, sagt Deepmind-CEO Demis Hassabis im Gespräch mit Techcrunch. „Und ich denke, das sollte zu ganz neuen Herangehensweisen für die Lösung offener Fragen und zu neuen Experimenten führen.“