
Der KI-Bereich bewegt sich zunehmend in Richtung multimodaler Sprachmodelle. Darunter versteht man KI-Modelle, die nicht nur einfache Textprompts verstehen, sondern auch Töne, Bilder und sogar Videos. Entsprechende Modelle können eingesetzt werden, um mit einer Kamera aufgenommene Szenen auszuwerten, um etwa Gehörlosen zu erklären, was auf den Aufnahmen zu sehen ist.
- Zugriff auf alle Artikel auf t3n.de
- t3n Magazin und Technology Review in Digitaler Form
- Reduzierte Werbung
- Wöchentlicher Newsletter
im ersten Monat, danach ab 10,36 € pro Monat
Jetzt testenDu bist bereits Plus- oder Pro-Member?
Hier anmelden
Kim Rixecker betreut bei t3n das Ressort Software & Infrastruktur. Darüber hinaus kümmert er sich einmal wöchentlich als Chef vom Dienst um die Planung und Koordinierung der Online-Inhalte auf t3n.