KI von Stability AI erobert die dritte Dimension: Das kann Stable Video 3D
Eine generative KI, die aus einem einzelnen zweidimensionalen Bild ein 3D-Modell erstellen kann, das sich von allen Seiten sowie aus allen Perspektiven darstellen und auch noch in einem Video animieren lässt – nicht weniger verspricht das KI-Unternehmen Stability AI in einem Blogpost über sein neues Produkt Stable Video 3D (SV3D).
Stable Video 3D: Vom 2D-Bild zum 3D-Modell
Bislang zeichnete Stability AI sich hauptsächlich durch sein Text-Bild-Generierungsmodell Stable Diffusion aus, auf dem beispielsweise auch generative Bild-KI wie Leonardo AI oder Runway basieren. Auch kurze Videos durch Bild- oder Text-Prompts waren mittlerweile möglich.
Schon im vergangenen Jahr ist das Unternehmen mit Stablecode aber auch in die KI-basierte Erstellung von Programm-Codes eingestiegen. Der neueste Streich SV3D könnte vor allem in der Gaming- oder Filmbranche sowie beim E-Commerce Anklang finden.
Wie Stability AI auf seiner Homepage erklärt, kann man mit SV3D aus einem Einzelbild ein 3D-Polygon-Modell erstellen lassen, das sich dann auch in Bewegtbildern beziehungsweise Videos einfügen lässt. Das Programm berechnet aus einer zweidimensionalen Aufnahme die weiteren Proportionen und die nicht abgebildeten Teile eines Objekts einfach hinzu und macht es so dreidimensional aus allen Perspektiven darstellbar.
Stable Video 3D: Konsistente Ergebnisse aus allen Blickwinkeln
Bisher litten solche Versuche laut Stability AI immer an nicht konsistenter Darstellung und limitierten Perspektiven. Das soll jetzt aber der Vergangenheit angehören. Bei der Vorgänger-Software Stable Zero 123 konnten Nutzer:innen zwar aus Bild oder Text ein 3D-Bild erstellen lassen, Animation und Bewegung waren allerdings nicht möglich.
SV3D kann jetzt statt einem viele Bilder liefern, die zu einem konsistenten Ergebnis zusammengesetzt werden. Zusätzlich zur bloßen Darstellung der Objekte bietet SV3D auch ein abgekoppeltes Beleuchtungsmodell.
SV3D ist jetzt zum kommerziellen Gebrauch für Abonennt:innen der Professional Membership von Stability AI (20 US-Dollar im Monat) verfügbar. Nicht-Kommerzielle Nutzer:innen können die Model-Weights bei Hugging Face herunterladen.
Die Möglichkeit, Fotos schnell in animierbare 3D-Modelle übersetzen zu lassen, könnte vor allem bei der Spieleentwicklung oder im Film äußerst praktisch sein und durch den extrem verminderten Arbeitsaufwand die Kosten enorm senken. Auch in der E-Commerce-Branche sieht Stability AI Potenzial, damit Kund:innen zum Beispiel in Onlineshops Waren in einem 360-Grad-Video betrachten könnten.