DaLAI Lama ist ein Spiel, das versucht, ein grundlegendes Problem im Bereich Legal Tech in Deutschland zu adressieren:
KI-Systeme benötigen eine große Zahl an qualitativ hochwertigen Daten, um rechtliche Alltagsprobleme in juristische Fachsprache übersetzen und verarbeiten zu können. Solche Daten fehlen aktuell (noch)!
Was ist Legal Tech?
Bei Legal Tech geht es um die Digitalisierung juristischer Tätigkeiten. Technologische Innovation soll dabei helfen, die Arbeitstätigkeit von professionellen Jurist:innen effizienter zu gestalten und den Zugang zum Recht für Verbraucher:innen und Unternehmen zu erleichtern. Eine dieser transformativen Technologien ist Künstliche Intelligenz (KI).
Was ist KI?
KI-Systeme unterscheiden sich von bisherigen Computerprogrammen vor allen in einem Punkt: Sie sind lernfähig!
Wie ein kleines Kind (oder besser: Ein kleines Lama!) lernt KI, indem sie viele Beispiele sieht und versucht, darin Muster und Regeln zu erkennen. Das geht auch in Bereichen, die mit Sprache arbeiten, also auch im Bereich des Rechts. Diesen sehr technischen Bereich nennt man Natural Language Processing (NLP).
Was ist das Problem?
Um zu lernen, brauchen KI-Systeme viele, sehr viele Daten. Diese sollten am besten auch noch schön strukturiert und markiert (“gelabelt”) sein, damit das System einfacher erkennt, was es eigentlich lernen soll. Daten zu strukturieren ist jedoch eine äußerst mühsame Arbeit. Mittlerweile gibt es sogar viele Unternehmen, die ihre Mitarbeiter:innen den ganzen Tag nur Daten labeln lassen. Oft aber mit wenig Erfolg: Durch die monotone Arbeit nimmt die Konzentration schnell ab, worunter die Qualität der Arbeit leidet. Im Rechtsbereich ist es außerdem gar nicht so einfach, spezielle Daten zu labeln (z.B. Textdaten in Form von Sachverhalten). Nicht ohne Grund muss man in Deutschland viele Jahre studieren, um sich Jurist:in nennen zu dürfen. Das heißt: Um die aktuelle Datenarmut im Bereich des Rechts zu beheben, brauchen wir eine Lösung.
Und jetzt kommt ihr ins Spiel
Das Gute ist: Zusammen können wir dieses Problem lösen! Wichtig ist, dass dabei niemand das Gefühl haben muss, eine Entwicklung zu unterstützen, die anstrebt, alle Jurist:innnen durch KI-Systeme zu ersetzen. Legal Tech zielt darauf ab, Jurist:innen in ihrer Arbeit zu unterstützen, diese zu verbessern und repetitive Aufgaben so zu übernehmen, dass man sich auf die wesentlichen Fragen konzentrieren kann.
Was ist das Ziel?
Das große Ziel unseres Projekts ist ein KI-System (Open-Source), das in einfachen Texten rechtliche Alltagsprobleme erkennen kann.
Unser KI-System soll die beschriebenen Rechtsprobleme entdecken können. Das eröffnet eine Vielzahl von Anwendungsmöglichkeiten. Rechtslaien können schneller und automatisiert Abhilfe für ihre Problemen finden, z.B. in Form von Info-Materialien oder der Empfehlung eines speziellen Fachanwalts. Unternehmen oder Behörden könnten durch die Verwendung des Systems einfacher begreifen, wovon eine hilfesuchende Person spricht und diese automatisiert direkt der richtigen Arbeitsstelle zuweisen. Die Möglichkeiten sind vielfältig!
DaLAI Lama hilft dabei, das Problem der Datenarmut zu lösen, indem es die Trainingsdaten für ein solches KI-System erzeugt. Den Spieler:innen wird ein Sachverhalt vorgelegt, der ein rechtliches Alltagsproblem beschreibt. Diese Sachverhalte stammen von Reddit, einer Social-Media-Plattform, auf der unter “r/legaladviceGerman” tägliche unterschiedliche Leute nach Antworten auf ihre Rechtsprobleme warten.
Zu diesen Sachverhalten werden Fragen gestellt. Die Nutzer:innen werden herausgefordert, mögliche Rechtsprobleme zu erkennen. Diese werden am Ende den Sachverhalten zugeordnet, um sie zu labeln und als Trainingsdaten für das KI-System zu verwenden (dieser Auswahlprozess ist natürlich noch ein bisschen komplizierter…).
Woher kommen die Labels?
Die möglichen Rechtsprobleme, die in den Sachverhalten identifiziert werden können, stammen aus einer selbsterstellten Datenbank, die wir RAPIT nennen – “Rechtliche Alltagsprobleme Index Taxonomie”. Diese probiert alle möglichen rechtlichen Probleme, die jemand in Deutschland haben kann, zu sammeln und mit einem Index zu versehen (…natürlich Open-Source, sodass jeder damit arbeiten kann).
Diese Arbeit ist ein langwieriger Prozess: Nicht nur dauert es lange, möglichst viele Rechtsprobleme zu sammeln. Weil sich Recht im Laufe der Zeit ändert, muss die Taxonomie ebenfalls kontinuierlich gepflegt und erweitert werden. Zudem erfordert es viele Fachkenntnisse und konsequente gegenseitige Überarbeitungen, sodass keine Labels doppelt auftauchen, einheitlich gearbeitet und nichts vergessen wird, was RAPIT verzerren könnte (…um Bias zu vermeiden).
Unten findest Du die aktuelle, (sehr) vorläufige Version von RAPIT, die zurzeit verwendet wird, um die Test-Phase von DaLAI Lama durchlaufen zu können. Wenn du mithelfen kannst und willst oder mehr erfahren möchstest, kontaktiere uns gerne!