ChatGPT für Klänge: Neue Meta-KI erzeugt Musik aus Textbeschreibungen
Meta hat eine neue generative KI vorgestellt, die Klänge aus Textbeschreibungen erstellen kann. Sie funktioniert ähnlich wie generative Bild-KI, wo Nutzer mit Worten beschreiben, was sie sehen wollen, und die künstliche Intelligenz das entsprechende Bild erstellt. Nur eben mit Musik.
Das Tool ist auf Hugging Face zur freien Nutzung verfügbar. Hier könnt ihr ganz einfach beschreiben, welche Art von Musik für euch generiert werden soll, und das Tool macht sich direkt an die Arbeit. Allerdings kann das ein wenig dauern. Rund 200 Sekunden solltet ihr für die Generierung einplanen.
Heraus kommt dann ein zwölf Sekunden langes Musikstück, das ihr frei nutzen könnt, auch kommerziell, wie Engadget schreibt. Außerdem könnt ihr die KI mit einer bereits vorhandenen Melodie vorkonditionieren. Dafür ladet ihr diese einfach in dem vorgesehenen Fenster hoch. Das ist allerdings optional.
Langes Training zahlt sich aus
Um die KI zu trainieren, hat das Team von Meta 20.000 Stunden lizenzierter Musik verwendet. Davon stammen rund 10.000 Stunden von einem internen Datensatz und der Rest von Shutterstock und Pond5.
Unter der Haube kommt Metas 32-Kilohertz-Codec-Audio-Tokenizer zum Einsatz. Der erlaubt es, kleine Musikstücke parallel zu bearbeiten.
Wer Musicgen auf seiner eigenen Hardware testen möchte, kann auch das tun. Alle dafür nötigen Daten sind auf GitHub zu finden. Wichtig dafür ist eine dedizierte Grafikkarte. Die Entwickler empfehlen auf dieser mindestens 16 Gigabyte RAM. Leistungsstärkere Grafikkarten können längere Stücke schneller erstellen.
Google hat eigene Musik-KI veröffentlicht
Meta ist aber nicht der erste Techriese, der seine Musik-KI öffentlich zur Verfügung stellt. Bereits im letzten Monat hat Google seinen Musikgenerator namens MusicLM für die Öffentlichkeit zugänglich gemacht.
Dieser funktioniert ganz ähnlich wie Metas Musik-KI. Nutzer tippen in Worten, welche Art von Musik sie hören möchten, und die KI generiert zwei Songs, von denen Nutzer einen auswählen können.
Musik im Stil von oder mit den Stimmen von bekannten Künstlern kann allerdings nicht generiert werden, da hier Bedenken bezüglich des Urheberrechts bestehen.
Und wieder mal ein Blödsinn, den die Welt nicht braucht.
Mit der Arbeitsleistung hätte man auch etwas Sinnvolles machen können!