ChatGPT für Biologen: Diese KI erschafft maßgeschneiderte Proteine per Texteingabe

Ein Team von Forscher:innen um den KI-Wissenschaftler Fajie Yuan hat mit „Pinal“ ein Modell vorgestellt, das genau das leistet. Es soll vor allem Biolog:innen ohne tiefgreifende Programmierkenntnisse ermöglichen, per Texteingabe maßgeschneiderte Proteine zu entwerfen. Entwickelt wurde die KI an der Westlake University im chinesischen Hangzhou.
Der eigentliche Härtetest für ein solches System ist nicht irgendein Protein, sondern der Entwurf eines funktionierenden Enzyms. Diese hochkomplexen Moleküle agieren als die biologischen Katalysatoren des Lebens und müssen auf das Atom genau gefaltet sein, um ihre Aufgabe zu erfüllen.
Genau diesen anspruchsvollen Nachweis erbrachte das Team um Fajie Yuan. Auf den einfachen Befehl, ein Protein zum Alkoholabbau zu designen, lieferte Pinal mehrere Kandidaten, von denen – wie das Magazin Singularity Hub berichtet – zwei im Labor die gewünschte katalytische Funktion zeigten.
Dieser direkte Weg von einer umgangssprachlichen Idee zu einer funktionierenden biologischen Maschine begeisterte den leitenden Wissenschaftler: „Wir sind die Ersten, die ein funktionierendes Enzym nur mit Text entworfen haben. Es ist wie Science-Fiction.“
Der Sprung von der Analyse zur kreativen Schöpfung
Dieser Durchbruch markiert den nächsten logischen Schritt in der KI-getriebenen Biologie. Bisherige Fortschritte, wie etwa Alphafold von Googles Deepmind aus London, konzentrierten sich auf die Analyse des Bestehenden. Das System lernte, die dreidimensionale Struktur von Proteinen vorherzusagen.
Da die 3D-Struktur die Funktion eines Proteins bestimmt, war dies der Schlüssel, um die Aufgaben unzähliger bereits existierender Proteine zu verstehen. Mit anderen Worten hat Alphafold die Landkarte des Lebens zwar entschlüsselt, aber nicht neu gezeichnet.
Pinal geht diesen entscheidenden Schritt weiter. Das System analysiert nicht nur, was existiert, sondern erschafft auf Befehl völlig Neues. Damit wechselt die KI von der Rolle des Analytikers in die eines kreativen Entwicklers, der funktionale, biologische Software schreibt. Das senkt die Hürden für Innovationen drastisch, die bislang oft am langwierigen Prozess der Modifikation bekannter Proteine scheiterten.
Vom Prompt zur „biologischen Software“: So arbeitet Pinal
Die besondere Leistung von Pinal liegt in seinem cleveren Zwei-Stufen-Prozess. Die KI versucht nicht, den komplexen Sprung vom Text zur fertigen Aminosäuresequenz in einem einzigen, fehleranfälligen Schritt zu vollziehen. Stattdessen folgt sie einer Logik, die der modernen Software-Entwicklung sehr ähnlich ist.
Im ersten Schritt agiert Pinal wie ein Systemarchitekt. Der Text-Prompt des Nutzers wird in eine Art technischen Bauplan für das Protein übersetzt. Dieser Plan beschreibt noch nicht die einzelne Aminosäure, sondern lediglich die gewünschte grobe 3D-Form und die Anordnung der wichtigsten funktionellen Bausteine.
Erst im zweiten Schritt kommt das spezialisierte Protein-Sprachmodell namens SaProt zum Einsatz. Man kann es sich als einen hoch spezialisierten Programmierer vorstellen, der den Bauplan erhält. Seine Aufgabe ist es, daraus Zeile für Zeile den passenden „biologischen Code“ zu schreiben. Das ist dann die exakte Abfolge der Aminosäuren, die sich im Anschluss verlässlich zur gewünschten Struktur zusammenfaltet.
Um diese komplexe Übersetzungsleistung zu erlernen, wurde das Gesamtsystem mit einem riesigen Datensatz von 1,7 Milliarden Protein-Text-Paaren gefüttert. Die KI lernte so, welche Textbeschreibungen zu welchen Molekülstrukturen gehören.
Die technische Grundlage beschreibt das Team in einem Vorabdruck auf bioRxiv. Zudem stellt das Team das Modell und den Code transparent auf Github zur Verfügung.
Anwendungen: Medizin, Umwelt und neue Materialien
Die denkbaren Anwendungsfelder sind enorm und könnten ganze Branchen verändern.
- In der Medizin könnten etwa passgenaue Antikörper entwickelt werden, die spezifisch an Krebszellen binden und Wirkstoffe gezielt abliefern, was die Nebenwirkungen von Therapien minimieren könnte.
- Für die Umwelttechnik ließen sich Enzyme entwerfen, die hartnäckige Kunststoffe wie PET bei niedrigen Temperaturen zersetzen oder CO₂ aus der Atmosphäre binden und so zur Kreislaufwirtschaft beitragen würden.
- In der Materialwissenschaft sind biologische Klebstoffe, selbstreparierende Beschichtungen oder extrem leichte, aber stabile Faserproteine denkbar, deren Eigenschaften in der Natur kein Vorbild haben.
Ausblick: Zwischen digitalem Entwurf und Laborrealität
Trotz des beeindruckenden Erfolgs steht die Technologie erst am Anfang. Als sogenannter Preprint hat die Studie noch kein unabhängiges Peer-Review-Verfahren durchlaufen. Jeder von Pinal entworfene Proteinkandidat muss zudem den langen und aufwendigen Weg der Validierung im Labor gehen.
Wie die Forscher selbst anmerken, kämpft Pinal zudem mit ähnlichen Problemen wie andere KI-Modelle. Auch Pinal neigt zum „Halluzinieren“, also zum Erzeugen instabiler oder unsinniger Sequenzen. Der Erfolg hängt außerdem stark von der präzisen Formulierung der Texteingabe ab. Das „Prompt Engineering“ wird damit auch für Biolog:innen zu einer Schlüsselqualifikation.
14 relevante chinesische Plattformen und Apps