KI soll die Suche nach neuen Materialien beschleunigen – Meta will mit einem Geschenk vorne mitmischen

Um gänzlich neue Materialien zu finden, berechnen Wissenschaftler:innen die Eigenschaften von Elementen aus dem chemischen Periodensystem, dann simulieren sie die Ergebnisse. KI könnte das vereinfachen und beschleunigen. (Symbolfoto: Gorodenkoff/Shutterstock)
Meta veröffentlicht unter dem Namen Open Materials 2024 (OMat24) einen umfangreichen Datensatz samt dazu passender Modelle, die Wissenschaftler:innen dabei helfen sollen, mithilfe von KI neue Materialien schneller zu entdecken – beziehungsweise ganz neue zu kreieren. Das OMat24 abgekürzte Projekt soll dabei einen der größten Engpässe in diesem Bereich schließen: ausreichende Mengen an Trainingsdaten.
Um gänzlich neue Materialien zu finden, berechnen Wissenschaftler:innen die Eigenschaften von Elementen aus dem chemischen Periodensystem und simulieren dann verschiedene Kombinationen am Computer. So sollen neue Materialien mit Eigenschaften entstehen, die unter anderem dazu beitragen könnten, den Klimawandel zu bekämpfen. Dazu gehören etwa neuartige Batterien oder nachhaltigere Energieträger. Damit das funktioniert, sind jedoch riesige Datensätze erforderlich, die bislang nur schwer zu beschaffen sind. Sie zu erstellen, erfordert zum einen enorme Rechenleistung, zum anderen ist der Prozess sehr teuer.
Open Materials 2024: Modelle und Trainingsdaten stehen quelloffen zur Verfügung
Viele der bislang besten Datensätze und Modelle, die dafür verfügbar sind, sind außerdem urheberrechtlich geschützt. Forscher:innen haben oft keinen freien Zugang zu ihnen. Hier hofft jetzt der Konzern Meta, helfen zu können: Das Unternehmen veröffentlicht einen eigenen Trainingsdatensatz samt ersten Modellen kostenlos und stellt sie quelloffen zur Verfügung. Beides ist in der KI-Community Hugging Face verfügbar und kann von jedermann heruntergeladen, ausprobiert und verwendet werden.
„Wir sind der festen Überzeugung, dass die gesamte Forschungscommunity schneller vorankommt, wenn wir alle unseren Beitrag leisten und auf Open-Source-Datenmodellen aufbauen“, sagt Larry Zitnick, leitende Forscher des OMat24-Projekts. Er meint, dass das neue OMat24-System bald die Matbench Discovery-Rangliste anführen wird, in der die besten Machine-Learning-Modelle für den Bereich Materialwissenschaft aufgeführt sind. OMat24 wird auch einer der größten verfügbaren Trainingsdatensätze sein.
Revolution dank KI?
„Die Materialwissenschaft erlebt eine Revolution des maschinellen Lernens“, sagt Shyue Ping Ong, Professor für Nanoengineering an der University of California, San Diego, der nicht an dem Projekt beteiligt war.
Bisher war die Forschung darauf beschränkt, sehr genaue Berechnungen von Materialeigenschaften an sehr kleinen Systemen durchzuführen – oder weniger genaue Berechnungen an sehr großen Systemen. Diese Verfahren waren mühsam und teuer, so Ong. Maschinelles Lernen habe diese Lücke geschlossen und KI-Modelle ermöglichten es Wissenschaftler:innen, Simulationen für Kombinationen beliebiger Elemente im Periodensystem viel schneller und kostengünstiger durchzuführen, sagt er.
Metas Entscheidung, seinen Trainingsdatensatz öffentlich zugänglich zu machen, sei bedeutender als die mitgelieferten KI-Modelle, kommentiert Gábor Csányi, Professor für molekulare Modellierung an der University of Cambridge, der OMat24 kennt. „Dies steht in krassem Gegensatz zu anderen großen Unternehmen wie Google und Microsoft, die kürzlich ebenfalls wettbewerbsfähige Modelle im Sektor veröffentlicht haben, die auf ebenso großen, aber geheimen Datensätzen trainiert wurden“, sagt Csányi.
Um den OMat24-Datensatz zu erstellen, nahm Meta einen bereits existierenden Datensatz namens Alexandria und entnahm ihm eine Stichprobe von Materialien. Dann führten die Forscher:innen der Facebook-Mutter verschiedene Simulationen und Berechnungen mit verschiedenen Atomen durch, um den Datensatz zu skalieren. Metas Datensatz umfasst etwa 110 Millionen einzelne Datenpunkte und ist damit um ein Vielfaches größer als frühere freie Trainingsdatensätze. Andere Anbieter hätten auch nicht unbedingt qualitativ hochwertigere Daten, sagt Ong.
Neue Materialien für AR-Brillen
Meta hat den Datensatz deutlich über das hinaus erweitert, was die Materialwissenschaft bisher gemacht habe – und das mit hoher Genauigkeit, meint der Nanoingenieur. Die Erstellung der Datensätze erfordere enorme Rechenkapazitäten. Meta ist eines der wenigen Unternehmen weltweit, die sich das überhaupt leisten können.
Forschungsleiter Zitnick sagt, dass das Unternehmen ein weiteres, wenn auch eigennütziges Motiv für diese Arbeit hat: Es hofft, neue Materialien zu finden, um seine neuen Augmented-Reality-Brillen erschwinglicher zu machen.
Andere Tools für die Materialwissenschaft
Frühere Arbeiten an offenen Datenbanken, wie die des Materials Project, haben die rechnergestützte Materialwissenschaft in den letzten zehn Jahren verändert, sagt Chris Bartel, Assistenzprofessor für Chemieingenieurwesen und Materialwissenschaften an der Universität von Minnesota.
Tools wie Googles GNoME, die Graphical Networks for Material Exploration, hätten gezeigt, dass das Potenzial, neuartige Materialien zu finden, mit der Größe der Trainingsmenge zunimmt, fügt er hinzu. „Die Veröffentlichung des [OMat24]-Trainingsdatensatzes ist ein wahres Geschenk für unsere Community und wird die Forschung in diesem Bereich sicher sofort beschleunigen.“