Bildbearbeitung: KI-Modell von Meta kann Objekte entfernen, die es gar nicht kennt
Mit Sam (Segment Anything Model) hat Meta ein KI-Modell vorgestellt, das Objekte in Bildern und Videos pixelgenau markiert (Segmentierung). Neben dem System stellt Meta auch die dahinterstehende Trainingsdatenbank zur Verfügung.
Laut Meta hat das System eine ungefähre Vorstellung davon, was Objekte sind. Dadurch ist die Erkennung von Objekten möglich, auch wenn die KI nicht konkret darauf trainiert wurde.
Das KI-Modell erleichtert das Freistellen von einzelnen Objekten in Bildern und Videos, kann aber ebenso zur Erkennung und Benennung von Objekten verwendet werden. Meta sieht AR- und VR-Headsets als einen möglichen Anwendungsbereich.
Meta-Demo: Sam kostenlos ausprobieren
Sam steht für Interessierte schon als kostenlos nutzbare Demoversion bereit. Neben den bereitstehenden Beispielbildern lassen sich auch eigene Bilder hochladen, um die Markierungsfähigkeiten des Systems auszuprobieren.
In der Demoversion funktioniert das Ganze per Mausklick oder über das Aufziehen eines Auswahlrechtecks. Zudem lassen sich auch ganze Bilder automatisch segmentieren.
KI stellt Objekte frei und in 3D dar
Künftig soll es auch möglich sein, Objekte per Sprachbefehl zu erkennen und etwa freizustellen. Dann könnte Sam diese Objekte auch in 3D darstellen, wie es in einem entsprechenden Blogbeitrag heißt.
Über die Bild- und Videobearbeitung sowie Augmented-Reality-Anwendungen hinaus sieht Meta sein KI-Modell für eine Reihe weiterer Einsatzzwecke als geeignet an. So könnte es bei wissenschaftlichen Untersuchungen von natürlichen Ereignissen auf der Erde oder im Weltraum helfen. In der Landwirtschaft soll Sam ebenso nützlich werden können wie in der biologischen Forschung.
Riesiger Datensatz für Forschungszwecke
Neben dem KI-Modell Sam stellt Meta – zunächst für Forschungszwecke – auch den dahinterstehenden Datensatz zur Verfügung. Die SA-1B genannte Datenbank enthält rund elf Millionen Bilder sowie 1,1 Milliarden Masken zur Segmentierung von Bildern.
Intern soll Facebook auf eine Sam-ähnliche KI-Technologie setzen, um etwa Fotos zu markieren und Beiträge zu moderieren, wie der Standard schreibt. Auch die Auswahl zu empfehlender Beiträge auf Facebook und Instagram übernimmt demnach die KI.
Meta setzt auf KI-Entwicklung
Wie viele Techkonzerne sieht auch Meta sein Heil derzeit in der KI-Technologie. Mit Llama hat der Konzern von Mark Zuckerberg etwa ein KI-Sprachmodell am Start, das ChatGPT Konkurrenz machen soll.
Kürzlich hat die Facebook-Mutter mit Make-a-Video ein KI-Tool präsentiert, das künftig Videos über die Eingabe von Textbefehlen erstellen soll. Auch die Nutzung von eigenem Bildmaterial soll damit möglich sein.