Das hier ist das erste „faire“ KI-Modell ohne Copyright-Verletzungen
Während große KI-Unternehmen wie OpenAI darauf beharren, dass das Training künstlicher Intelligenzen ohne Urheberrechtsverletzungen nicht möglich sei und dieses Vorgehen dem „fair use“ unterliege, ist es ausgerechnet ein Jura-KI-Modell, das die Behauptung der Alternativlosigkeit jetzt zumindest teilweise in Frage stellt.
Das Kelvin Legal Large Language Model (kurz Kl3m, gesprochen wie „Klem“) wurde ausschließlich mit öffentlich zugänglichem, nicht unter das Urheberrecht fallendem Material trainiert. Dafür hat die KI jetzt auch eine Auszeichnung mit dem Model-L-Zertifikat der Non-Profit-Organisation Fairly Trained erhalten.
KI ohne Urheberrechtsverstöße: Kl3m basiert auf legalem Datensatz
Entwickelt wurde Kl3m vom Startup 273 Ventures. Dahinter verbergen sich Daniel Martin Katz, Jura-Professor des Illinois Institute of Technology und Rechtspflege-Tech-Unternehmer Michael Bommarito. Gemeinsam wollten sie den Versuch unternehmen, eine brauchbare künstliche Intelligenz zu schaffen, die völlig ohne Copyrigh-Verletzungen auskommt – was ihnen scheinbar auch gelungen ist.
Als Trainingsdaten dienten ausschließlich alte Gerichtsdokumente und öffentlich zugängliche Dokumente der US-Regierung. Mehr als 10.000 Dokumente wurden dafür manuell auf ihre Brauchbarkeit im Sinne des gewahrten Urheberrechts überprüft . Entstanden ist daraus ein Datensatz von rund 50 Milliarden Tokens.
Eine abgespeckte Version mit etwa 150 Milliarden Tokens hat 273 Ventures zu einem eigenständigen Produkt zusammengezurrt, dem Kelvin Legal Data Pack.
Legal trainierte KI teils besser als Konkurrenz von Microsoft
Laut Hersteller können Kanzleien und andere Institutionen des Rechtswesens mit Kl3m unter anderem Rechnungen erstellen, Anträge entwerfen und diese überprüfen lassen, Vertragsklauseln überarbeiten oder Patentanträge ausarbeiten. Wie Katz in einem Interview mit Venture Beat andeutete, könne das Programm aber noch erstaunlich viel mehr, da das Rechtswesen praktisch alle Lebensbereiche berühre.
Das Model-L-Zertifikat, mit dem Kl3m jetzt ausgezeichnet wurde, erhalten ausschließlich KI-Modelle, die nachweislich und genauestens geprüft auf keinerlei urheberrechtsgeschütztes Material zurückgreifen. Vergeben wird es von Fairly Trained, einem Non-Profit-Unternehmen, das von Ex-StabilityAI-Executive Ed Newton-Rex gegründet wurde .
In Testläufen schnitt die Software in Sachen Perplexität und Toxische Outputs zumindest in bestimmten Bereichen besser ab als beispielsweise Phi-2 von Microsoft. Laut Hersteller ist Kl3m bereits in einigen Kanzleien im Einsatz.