
Meta will im KI-Game nachziehen. (Bild: Shutterstock/Daniel Constante)
Nach OpenAI, Google und vielen weiteren hat jetzt auch Meta eine Sammlung aus Sprachmodellen vorgestellt.
Damit will Mark Zuckerberg der Konkurrenz zu Leibe rücken: Das „Large Language Model Meta AI“ übertreffe „GPT‑3 (175B) bei den meisten Benchmarks“, heißt es in der Ankündigung auf dem Facebook-Forschungsblog, LLaMA-65B könne außerdem „mit den besten Modellen, Chinchilla 70B und PaLM-540B“, mithalten.
„Large Language Model Meta AI“ soll mit Google und OpenAI mithalten
Chinchilla 70B wurde 2022 von der Google-Tochter Deepmind vorgestellt, auch PaLM-540B kommt aus dem Hause Google. Die GPT‑3-Variante mit 175 Milliarden Parametern (175 B) dient als Grundlage für den gehypten Chatbot ChatGPT.
In der Entwicklung seiner neuen Sprachmodelle will Meta „ausschließlich öffentlich verfügbare Datensätze“ verwendet haben. Das soll dafür sorgen, dass das „Large Language Model Meta AI“ mit Open Source kompatibel und reproduzierbar ist.
Die genauen Informationen zu LLaMA sind in einem Forschungs-Paper zusammengefasst, via Github können Interessierte zudem ein relativ simples Code-Beispiel ausprobieren. Wer sich allerdings näher mit der Meta-Technologie beschäftigen will, muss sich per Google-Formular um die Modelldaten bewerben.
Metas ChatGPT-Konkurrent: Vorerst keine Integration in Instagram und Facebook
Was die Verwendung angeht, soll LLaMA zunächst vor allem Forschenden helfen, „ihre Arbeit voranzubringen“, so Mark Zuckerberg in einer Ankündigung via Facebook. „LLMs haben sich als sehr vielversprechend erwiesen, wenn es darum geht, Texte zu generieren, Gespräche zu führen, schriftliches Material zusammenzufassen und kompliziertere Aufgaben wie das Lösen mathematischer Theoreme oder die Vorhersage von Proteinstrukturen zu lösen“, heißt es vo dem Konzernchef.
Anders als beispielsweise OpenAIs ChatGPT, das von Microsoft in die Bing-Suche integriert wurde, kommt das neue Sprachmodell von Meta einem Unternehmenssprecher zufolge vorerst noch nicht in Diensten wie Instagram und Facebook zum Einsatz.
Mit dem Release von LLaMA blickt die Netz-Community gespannt auf die ersten Gehversuche des Sprachmodells – bei Metas letztem KI-Projekt hatten die nämlich nach kurzer Zeit schon für Probleme gesorgt.
Das kann Stable Diffusion: