OpenAI hat Point-E veröffentlicht – eine künstliche Intelligenz, die aus Texteingaben 3D-Modelle erstellen kann.
Point-E ist wie Dall-E für 3D-Modelle
Egal, ob 3D-Brille, eine Vase mit lila Blumen oder ein Paar Overear-Kopfhörer – Point-E kann aus den jeder Eingabe farbige 3D-Modelle erstellen, die dem Original beziehungsweise der Vorgabe auch recht nahe kommen.
Aus der Texteingabe – zum Beispiel dem „Corgi, der eine Weihnachtsmütze trägt“ – rendert Point-E zunächst eine synthetische 3D-Ansicht. Von dieser Ansicht werden dann zahlreiche Diffusionsmodelle erstellt, bis das 3D-Modell im RGB-Farbmodell vorliegt – zunächst in einer recht groben Auflösung, später dann feiner.
Die Wissenschaftler:innen schreiben in ihrem Paper, dass es nur bedingt sinnvoll sei, Point-E und Dall-E 2 miteinander zu koppeln. Dall-E 2 neige dazu, Schatten unter einzelne Objekte zu platzieren – Point-E interpretiere diese aber als dunklen Untergrund.
Außerdem habe Point-E Schwierigkeiten mit Dall-E-2-Abbildungen, die zu viel Raum in der Darstellung einnehmen – hier könne es helfen, einen Rahmen drumherum zu setzen.
Auch Biases, also Voreingenommenheiten, spielen bei Point-E eine Rolle. Die Wissenschaftler:innen nennen als Beispiel, dass die KI „längere und schmalere“ Objekte errechnet, wenn sie das Stichwort „Frau“ erhält, als wenn sie einen „Mann“ darstellen soll.
Wer selbst gerne mit Point-E herumspielen möchte, findet den Code auf GitHub hinterlegt.
2022 ist das Jahr der KI
2022 kann guten Gewissens als das Jahr der künstlichen Intelligenzen bezeichnet werden. Neben Dall-E und ChatGPT aus dem Hause OpenAI sorgten auch Stable Diffusion und Midjourney immer wieder für Staunen über ihren Output.
Es gibt jedoch auch Kritik – von Urheberrechtsfragen über das Risiko von Deepfakes bis hin zu der Frage, ob und woran wir erkennen können, ob ein Text von einem Menschen oder einer KI erstellt wurde.