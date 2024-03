KI-Modelle greifen für ihr Training auf riesige Datensätze zu. In der Regel sind diese urheberrechtlich geschützt. In manchen Bereichen wäre das aber nicht nötig, wie ein neues LLM belegt. (Symbolbild: Shutterstock/pling)

Während große KI-Unternehmen wie OpenAI darauf beharren, dass das Training künstlicher Intelligenzen ohne Urheberrechtsverletzungen nicht möglich sei und dieses Vorgehen dem „fair use“ unterliege, ist es ausgerechnet ein Jura-KI-Modell, das die Behauptung der Alternativlosigkeit jetzt zumindest teilweise in Frage stellt.

Anzeige Anzeige

Das Kelvin Legal Large Language Model (kurz Kl3m, gesprochen wie „Klem“) wurde ausschließlich mit öffentlich zugänglichem, nicht unter das Urheberrecht fallendem Material trainiert. Dafür hat die KI jetzt auch eine Auszeichnung mit dem Model-L-Zertifikat der Non-Profit-Organisation Fairly Trained erhalten.

Entwickelt wurde Kl3m vom Startup 273 Ventures. Dahinter verbergen sich Daniel Martin Katz, Jura-Professor des Illinois Institute of Technology und Rechtspflege-Tech-Unternehmer Michael Bommarito. Gemeinsam wollten sie den Versuch unternehmen, eine brauchbare künstliche Intelligenz zu schaffen, die völlig ohne Copyrigh-Verletzungen auskommt – was ihnen scheinbar auch gelungen ist.

Anzeige Anzeige

Als Trainingsdaten dienten ausschließlich alte Gerichtsdokumente und öffentlich zugängliche Dokumente der US-Regierung. Mehr als 10.000 Dokumente wurden dafür manuell auf ihre Brauchbarkeit im Sinne des gewahrten Urheberrechts überprüft . Entstanden ist daraus ein Datensatz von rund 50 Milliarden Tokens.

Empfohlene redaktionelle Inhalte Hier findest du externe Inhalte von X Corp., die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte von X Corp. auf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.

Inhalte anzeigen Hier findest du externe Inhalte von, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte vonauf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden. Hinweis zum Datenschutz Leider ist etwas schief gelaufen... An dieser Stelle findest du normalerweise externe Inhalte von X Corp., jedoch konnten wir deine Consent-Einstellungen nicht abrufen.

Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Datenschutzeinstellungen verwalten An dieser Stelle findest du normalerweise externe Inhalte von, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Eine abgespeckte Version mit etwa 150 Milliarden Tokens hat 273 Ventures zu einem eigenständigen Produkt zusammengezurrt, dem Kelvin Legal Data Pack.

Anzeige Anzeige

Legal trainierte KI teils besser als Konkurrenz von Microsoft

Laut Hersteller können Kanzleien und andere Institutionen des Rechtswesens mit Kl3m unter anderem Rechnungen erstellen, Anträge entwerfen und diese überprüfen lassen, Vertragsklauseln überarbeiten oder Patentanträge ausarbeiten. Wie Katz in einem Interview mit Venture Beat andeutete, könne das Programm aber noch erstaunlich viel mehr, da das Rechtswesen praktisch alle Lebensbereiche berühre.

Das Model-L-Zertifikat, mit dem Kl3m jetzt ausgezeichnet wurde, erhalten ausschließlich KI-Modelle, die nachweislich und genauestens geprüft auf keinerlei urheberrechtsgeschütztes Material zurückgreifen. Vergeben wird es von Fairly Trained, einem Non-Profit-Unternehmen, das von Ex-StabilityAI-Executive Ed Newton-Rex gegründet wurde .

Anzeige Anzeige

In Testläufen schnitt die Software in Sachen Perplexität und Toxische Outputs zumindest in bestimmten Bereichen besser ab als beispielsweise Phi-2 von Microsoft. Laut Hersteller ist Kl3m bereits in einigen Kanzleien im Einsatz.

Mehr zu diesem Thema Künstliche Intelligenz