Anzeige
Anzeige
MIT Technology Review News

KI lernt Evolution und erschafft leuchtende Proteine: Warum das ein wichtiger Schritt ist

Ehemalige Meta-Mitarbeitende bringen einem Sprachmodell Evolution bei – und kreieren damit nützliche Biomoleküle. Ihr Erstlingswerk: ein fluoreszierendes Protein.

3 Min.
Artikel merken
Anzeige
Anzeige

Proteindesign am Computer.

Ob Glühwürmchen, Quallen oder Korallen: Fluoreszierende Proteine sind Meisterwerke der Natur – komplexe Moleküle aus Ketten und Spiralen. Entwickelt haben sie sich in Milliarden Jahren Evolution. Das Unternehmen EvolutionaryScale, gegründet von ehemaligen Meta-Mitarbeitenden, will für diesen Prozess nun einen Turbo entwickelt haben: ein besonders leistungsfähiges Sprachmodell mit Namen EMS3. Der Mitgründer Lux Capital nennt es gegenüber der Nachrichtenagentur Reuters den  „ChatGPT-Moment für die Biologie“.

Anzeige
Anzeige

Mit gezielten Prompts erzeugte das Modell ein grün leuchtendes Protein, das ähnlich kräftig leuchtete wie die natürlichen Verwandten und dennoch mit dem nächstähnlichen, bekannten Protein nur zu 58 Prozent übereinstimmte. Der Unterschied entspreche in der Evolution einem zeitlichen Abstand von mehr als 500 Millionen Jahren, berichtet das Startup. Das Unternehmen, das von ehemaligen Meta-Forschenden gegründet wurde, will sein Sprachmodell unter anderem für die Entwicklung von Medikamenten und für Nachhaltigkeitsthemen nutzen. Dafür steht laut Reuters eine Summe von 142 Millionen US-Dollar zur Verfügung.

„Wir wollen Werkzeuge entwickeln, um die Biologie programmierbar zu machen“, sagt Alex Rives, der leitende Wissenschaftler, im Fachblatt Nature. Zwar gebe es bereits Methoden, mithilfe von KI und sogenannten Diffusionsmodellen neuartige Proteinstrukturen zu entwerfen. Doch diese seien deutlich näher am natürlichen Vorbild und sie lieferten deutlich weniger vielversprechende neue Baupläne.

Anzeige
Anzeige

Sprache der Proteine

Proteine sind – zum Teil räumlich hochkomplexe – Aneinanderreihungen von Aminosäuren. „Es ist heutzutage Konsens, dass diesen Aminosäureseqeunzen eine fundamentale Sprache der Proteinbiologie zugrunde liegt“, schreiben die Entwicklerinnen und Entwickler in einem Paper auf dem Preprint-Server biorxiv. Und diese ließen sich mithilfe von Sprachmodellen verstehen. Auch wie sich die Sequenzen, Strukturen und Funktionen im Laufe der Evolution weiterentwickelt haben, sollten die Modelle lernen können.

Im Paper beschreiben die Forschenden, wie sie vorgegangen sind. Sie haben das Modell auf mehr als 2,7 Milliarden Proteine trainiert. Die Aminosäuresequenzen, die räumlichen Strukturen und die Funktionen zerlegten sie in kleinere Einheiten – wie einen Satz in Worte, was Fachleute Tokenisierung nennen. Für jeden der drei Aspekte wurden zudem immer wieder neue „Lückentexte“ erstellt, in denen per Zufallsprinzip verschiedene Einheiten maskiert wurden. Das Modell sollte dann diese Lücken füllen, also die fehlenden Elemente finden, und dadurch die gewünschten Zusammenhänge lernen.

Anzeige
Anzeige

Prompten mit Fachwissen

Allerdings: Einfach mal ein paar Wunscheigenschaften prompten, und das Sprachmodell spuckt das gewünschte, sagen wir, leuchtende Protein aus? So simpel funktioniert ESM3 dann doch nicht. Für das fluoreszierende Molekül mussten die Forschenden fundierte biochemische Kenntnisse haben und mehrere aufeinander aufbauende Prompts formulieren. Dann stellten sie nach den aussichtsreichsten Bauplänen im Labor fast 90 Proteine her und testeten deren Leuchtfähigkeiten. Die Variante, die am besten abschnitt, leuchtete allerdings deutlich schwächer als natürliche Pendants und nur für kurze Zeit. Die Forschenden optimierten ihren ersten Testsieger daher mit weiteren Prompts, synthetisierten und prüften nochmals etliche Kandidaten – und erhielten schließlich das Zielmolekül.

Die Konstruktion neuer fluoreszierender Proteine ist schon seit Jahrzehnten ein Forschungsthema. Aus guten Gründen: Biomoleküle können damit markiert werden. Sie werden dann in Spezialmikroskopen gut sichtbar und ihre Wege in einer Zelle oder einem anderen biologischen System lassen sich leicht nachverfolgen.

Anzeige
Anzeige

Protein-Manufaktur „open source“

Das neue Sprachmodell könnte aber auch als Protein-Manufaktur für andere Zwecke dienen. Schließlich dirigieren Eiweiße Stoffwechselvorgänge und sie sind wichtige Akteure unseres Immunsystems. Auch technologisch ließen sich die neuen Designmöglichkeiten nutzen, etwa um Proteine herzustellen, die Kunststoffe abbauen. „Wir haben uns zunächst für die Eigenschaft Fluoreszenz entschieden, weil sie schwer zu erreichen und leicht zu messen ist. Und sie zählt zu den wundervollsten Mechanismen der Natur“, heißt es im biorxiv-Paper.

Trotz Kritik, Modelle dieser Art könnten für die Entwicklung von Biowaffen missbraucht werden, will EvolutionaryScale sein Projekt weiter vorantreiben. Laut Reuters planen die Geldgeber Amazon Web Service und Nvidia zudem eine kommerzielle Nutzung der umfassendsten ESM2-Variante. Und das Startup stellt eine abgespeckte Version von ESM3 „open source“ der akademischen Forschung zur Verfügung. Ob das Sprachmodell dort als Turbo wirkt, bleibt abzuwarten.

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare (1)

Community-Richtlinien

Radovan Kubes

KI lernt Evolution und erschafft leuchtende Proteine: Warum das ein wichtiger Schritt ist

Es ist traurig, dass die Wissenschaft keine Fortschritte in Erforschung der tatsächlichen Vorgänge und er Simulation (chemisch Elemente kombinieren = perfekte Simulation (Temp., Druck,…) macht.
Regeln und Berechnungen sind etwas ganz Anderes im Vergleich zu derzeitigen KI-Funktionalität, bei der kommt etwas mit „Glück“ (Milliarden von virtuellen Versuchen ohne klare Regeln) heraus.
Man ist weit weg vom Programmieren, denn für das Programmieren muss man die Algorithmen der Natur verstehen, DAS IST ECHTES WISSEN!

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige