Atacworks heißt das Wunderwerk der Genom-Analyse. Es läuft auf Nvidia-Hardware, die auf maschinelles Lernen spezialisiert ist. Das Toolkit für maschinelles Lernen soll die Kosten und den Zeitaufwand für Gen-Experimente rapide senken. Erste Zahlen einer Studie aus der Fachzeitschrift Nature Communications bestätigen die Angaben. Atacworks analysiert demnach ein komplettes Genom in einer halben Stunde, während herkömmliche Methoden dafür viele Stunden brauchen.
Nvidia und Harvard: Hand in Hand
Das Programm arbeitet mit einer Methode von Jason Buenrostro. Der Harvard-Professor und Co-Autor der Studie hat ATAC-Seq entwickelt, darüber lassen sich über Signalmessungen offene Bereiche im Genom von Zellen auffinden. Diese Bereiche weisen auf spezielle Baupläne für die Funktion der Zelle hin, während die Komplett-DNA mit Milliarden von Basenpaaren im Zellkern eingesperrt ist. Die spezifischen DNA-Bereiche sind besser zugänglich, jedoch „verrauschen“ oft eine Menge Proteine das Bild. Buenrostos Methode hilft zwar, die beiden DNA-Arten zu unterschieden, dennoch braucht es Zehntausende Zellen, um ein sauberes Signal zu erhalten. Atacworks liefert die gleiche Qualität mit nur einigen Dutzend Zellen, schreiben die Autoren.
Atacworks lernt schnell
Das Modell lernte anhand von identischen ATAC-Seq-Datensätzen, von denen ein Teil verrauscht und einer hochwertig war. Dadurch kann es auch aus heruntergerechneten Daten eine genaue, hochwertige Version vorhersagen und schwache Signale richtig interpretieren. Mit Atacworks gelang es den Artikelautoren, einen Proteinkomplex in einer verrauschten Sequenz von einer Millionen Reads genauso gut zu erkennen wie über eine herkömmliche Methode in einem sauberen Datensatz von 50 Millionen Reads. Kurz: Die neue Technologie ermöglicht, mit einer niedrigeren Anzahl von Zellen zu forschen und in sehr viel kürzerer Zeit Ergebnisse zu erzielen.
Seltene Zellen können Forscher jetzt erst erfassen
Die Autoren setzten das System auf seltene Stammzellen an, die mit herkömmlichen Methoden nicht untersucht werden können. Sie konnten mit einem Probensatz von nur 50 Zellen unterschiedliche DNA-Regionen identifizieren, die mit Zellen assoziiert sind, die mit weißen Blutkörperchen und separate Sequenzen, die mit roten korrelieren. Die Hauptautorin Avantika Lal schlussfolgerte, Atacworks könne neben Kostensenkungen auch neue Möglichkeiten in der Medikamentenentwicklung und Diagnostik eröffnen.