Jusletter IT

KI-Projekte in der gerichtlichen Praxis

Wird KI wirklich alles verändern ?

  • Author: Frank Richter
  • Category of articles: Articles
  • DOI: 10.38023/dd6d237a-0d25-47ef-a54a-c4c4bb460bb7
  • Citation: Frank Richter, KI-Projekte in der gerichtlichen Praxis, in: Jusletter IT 4 July 2024
The introduction of artificial intelligence (AI) in judicial practice has gained significance in recent years, particularly through projects like FRAUKE and JANO. These projects aim to optimize the processing of mass litigation and efficiently anonymize judicial decisions. FRAUKE assists judges in drafting judgments using text modules, while JANO pseudonymizes judicial decisions to make them suitable for publication. Both projects have been successfully piloted and are intended for nationwide implementation. The acceptance of these technologies among the judiciary is high, and they offer great potential for the future of the justice system.
[1]

Diese Frage bewegt die gerichtliche Praxis seit etwa zwei Jahren und eine Antwort fällt aktuell noch schwer. Ja, künstliche Intelligenz verändert den Alltag von Richterinnen und Richter, aber momentan noch schleichend.

[2]

Begonnen hat alles eher langsam mit der Entdeckung eines Geschäftsmodells durch LegalTech Unternehmen für sogenannte «Massenverfahren» im Jahr 2018. Ein prominentes Beispiel dafür ist die EU Fluggastrechteverordnung 261/2004.

[3]

Seit 2004 gibt es die EU-Verordnung 261/2004 zu Flugannullierungen bzw. -verspätungen, die besagt, dass Kompensationsleistungen seitens einer Airline geleistet werden müssen, wenn Flüge ausfallen oder verspätet sind. Die Verordnung hat lange ein Schattendasein geführt, bis 2018 mit professionellen Start-ups eine Vielzahl von Rechtsdienstleistern am Rechtsmarkt erschienen sind und sich solcher Forderungen angenommen haben. Bei den deutschen Amtsgerichten gehen seitdem pro Jahr ca. 100.000 solcher Klagen ein, was die Richterschaft, aber insbesondere die Serviceeinheiten, vor enorme praktische Probleme in der Abarbeitung stellt.

[4]

Diese Klagen werden mit Hilfe künstlicher Intelligenz und besonderer LegalTech-Instrumente gefertigt, die Wetterdaten, Buchungsinformationen und Flugdaten aller durchgeführter Flüge auswerten.

[5]

Ohne diese Tools wäre eine Sachbearbeitung auf Klägerseite nicht wirtschaftlich möglich, da die Kompensationssummen mit 250 €, 400 € und 600 € abhängig von der Entfernung eines Fluges pro Passagier recht gering sind. Dies war auch der Grund, warum vor 2018 die Verordnung keine grosse Rolle spielte.

[6]

Dieses Phänomen inspirierte die Richterschaft des Amtsgerichts Frankfurt am Main, wo etwa 15.000 Fluggastrechteklagen jährlich eingehen, eine eigene KI zu entwickeln, damit sie auf die Klageflut reagieren kann.

[7]

Bei den Fluggastrechtfällen handelt es sich um Fälle, die repetitiv sind – es sind also praktisch immer ähnliche Flüge. Es geht um Sachverhalte, die in der Art und Weise sehr vergleichbar sind. Für die Prüfung einer möglichen Entschädigungsvoraussetzung sind folgende Punkte relevant: Die Entfernung, welche die Entschädigungssumme bestimmt und ob die Verspätung grösser als drei Stunden war oder ob der Flug annulliert wurde. Die Airline hat nur eingeschränkte Verteidigungsmöglichkeiten in diesen Fällen, nämlich sogenannte «außergewöhnliche Umstände» nach Art. 5 Abs. 3 der Fluggastrechteverordnung in mehreren Kategorien.

[8]

Dazu haben sich die Richterinnen und Richter beim Amtsgericht Frankfurt am Main überlegt: Wenn auf Anbieterseite eine starke Vereinheitlichung von Klagen durch Rechtsdienstleister besteht und es damit relativ wenige unterschiedliche Kläger und auch eine überschaubare Anzahl von betroffenen Airlines gibt, ist es sinnvoll, diese Fälle in ein strukturiertes Verfahren zu überführen.

[9]

Hier setzt das Projekt FRAUKE (FRAnkfurts UrteilsKonfigurator Elektronisch) an. Durch FRAUKE soll der richterliche Entscheidungsprozess durch den Einsatz von KI erleichtert werden, indem das Programm nach der richterlichen Entscheidung beim Verfassen des Urteils Textbausteine zur Verfügung stellt, die sich zu einem Urteil zusammensetzen.

[10]

FRAUKE soll also nicht den richterlichen Entscheidungsprozess übernehmen oder gar selbst Urteile fällen, sondern in Massenverfahren der Fluggastrechte aufgrund von Textfeldern in den elektronisch eingereichten Schriftsätzen die entscheidenden Felder auslesen und für diese Felder vorgefertigte Textbausteine aus Urteilen des gleichen Gerichts oder übergeordneter Institutionen anbieten. Diese Textbausteine werden aus einem Pool gespeist, welchen ein Textteam des Amtsgerichts Frankfurt am Main erstellt hat und in den neben den Entscheidungen aus Frankfurt auch Entscheidungen anderer Gerichte mit Fluggastrechtefällen, aber insbesondere die Rechtsprechung des Bundesgerichtshofs und des EUGH, angeboten wird.

[11]

Dieses Projekt wurden gemeinsam mit der IBM Deutschland GmbH basierend auf dem Programm Watson Natural Language Processing entwickelt, welches Datenfelder aus den elektronischen Schriftsätzen ausliest und dann mit den Textbausteinen zu einem Urteil kombiniert. FRAUKE sieht so aus, dass der Richter mit wenigen Klicks eine Entscheidung dahingehend treffen kann, ob er der Klage stattgibt, wie die Nebenentscheidungen sind oder ob er die Klage abweist. Und demensprechend bekommt er dazu die passenden Textbausteine sowie die dazu existierenden Urteile als Auswahl. Das heisst, das fertige Produkt, das ihm angeboten wird, ist bereits ein Urteilsvorschlag, den er individuell ergänzen kann.

[12]

Dieses Projekt gewann 2023 den Public Leadership Award auf der führenden Digitalmesse der öffentlichen Hand in der Kategorie Justiz. Aktuell befindet sich das Projekt kurz vor einer europaweiten Ausschreibung, damit aus dem beim Amtsgericht Frankfurt am Main verwendeten Prototyp ein bundesweit nutzbares Tool wird.

[13]

Dieser Gedanke der bundesweiten Nutzbarkeit ist es, den künftige Projekte alle mitbedenken sollten. Die Bundesrepublik Deutschland ist ein föderaler Staat und Justiz ist grundsätzlich in der Kompetenz der einzelnen Bundesländer. Für die Entwicklung von KI-Tools, aber noch mehr für deren Betrieb, ist dies eine nicht unbedeutende Hürde. Wenn KI-Anwendungen in der Nutzbarkeit an Grenzen von Bundesländern Halt machen würden, dann können diese nicht wirtschaftlich sein. Die Betriebskosten von KI-Anwendungen in Rechenzentren sind hoch und diese rechnen sich nur bei einer hohen Nutzeranzahl. Das dazu eingeholte Wirtschaftlichkeitsgutachten für FRAUKE bestätigte dies eindrucksvoll. Eine Nutzung nur in Hessen wäre wirtschaftlich nicht sinnvoll, eine Nutzung in der Bundesrepublik dagegen sehr.

[14]

Was bedeutet dies nun: Ist ein KI-Appstore möglich oder denkbar ?

[15]

Diese Frage wird gerade in der Bundesrepublik intensiv diskutiert. Es gibt ein gemeinsames Gremium aller Bundesländer und der Bundesgerichte, das die Einrichtung einer sogenannten Justizcloud propagiert, welche solche Anwendungen künftig hosten könnte. Diese Justizcloud ist trotz häufiger Erwähnung in Vorträgen und Publikationen noch Zukunftsmusik. Technisch ist sie nicht einfach und die datenschutzrechtlichen aber insbesondere die Betriebsfragen sind noch nicht geklärt. Dies bedeutet, dass die KI-Anwendungen zunächst in Rechenzentren der einzelnen Bundesländer laufen müssen und dort Zugänge für Gerichte jenseits der Landesgrenzen geschaffen werden müssen. Auch dies ist weder technisch noch datenschutzrechtlich einfaches Terrain. Hier müssen klare Standards und Betriebsroutinen entwickelt werden, damit dies funktioniert. Möglich ist es, aber herausfordernd, und so sollte man diese Aufgabe auch begreifen.

[16]

Welche Projekte könnten noch in diese Justizcloud ? Ein weiteres Projekt, das sich bereits in einer länderübergreifenden Pilotierung befindet, ist das Projekt JANO (JustizANOnymisierung). Dieses KI-Tool anonymisiert, genauer pseudonymisiert gerichtliche Entscheidungen. Diese Pseudonymisierung ist erforderlich, damit gerichtliche Entscheidungen in Zeitschriften oder Online-Datenbanken abrufbar einer Justizöffentlichkeit zur Verfügung gestellt werden können.

[17]

Heute geschieht diese Anonymisierung händisch durch Servicemitarbeiter, die Urteile und Beschlüsse auf personenbezogene Daten und sensible Inhalte durchsehen, welche nicht der Öffentlichkeit preisgegeben werden dürfen. Diese Tätigkeit ist aufwendig, zeitintensiv und ungeliebt. Daher werden in der Bundesrepublik weniger als 1 % aller Gerichtsentscheidungen veröffentlicht, eine sehr magere Quote.

[18]

Daher haben wir uns von folgender Überlegung leiten lassen: Wenn eine so geringe Zahl von wichtigen Entscheidungen veröffentlicht wird aus Mangel an Arbeitskraft und dem hohen Aufwand für die Anonymisierung, wäre ein erster Schritt die Vereinfachung dieses Prozesses durch Technik. Aufgrund unserer Erfahrung mit dem Projekt FRAUKE kommt daher erneut das KI-Modell der Firma IBM Watson Natural Language zum Einsatz.

[19]

Gemeinsam mit einer Arbeitsgruppe von gerichtlichen Praktikern wurden die inhaltlichen Anforderungen an eine Pseudonymisierung entworfen. Wichtig ist nicht nur das Anonymisieren von personenbezogenen Daten und urheberrechtskritischem Inhalt. Diese Texte müssen häufig klug pseudonymisiert werden, da sonst die Verständlichkeit des Textes bis hin zur völligen Unverständlichkeit massiv leidet.

[20]

Konkret meint dies, dass beispielsweise bei mehreren Beklagten klar sein muss, welcher Teil des Sachverhalts zu welchem Beklagten gehört und genauso auch, dass Adressen sinnvoll ausgetauscht werden, wenn verschiedene Orte in einer gerichtlichen Entscheidung Relevanz entfalten.

[21]

Diese inhaltlichen Anforderungen sind für ein KI-System nicht einfach umsetzbar, sondern erfordern eine sorgsame Programmierung, wie wir in mehreren Entwicklungszyklen feststellen durften.

[22]

Das aktuelle Modell von JANO wird gerade im Landgerichtsbezirk Hanau, dem Oberlandesgericht Frankfurt am Main und dem Landgericht Mannheim getestet. Durch diese breite Pilotierung soll es gelingen, einen möglichst umfangreichen Überblick zu erhalten. Das Oberlandesgericht hat typischerweise umfangreiche Urteile zu anonymisieren, das Landgericht Mannheim ist ein Spezialgericht für Urheberrechtsstreitigkeiten mit viel geschütztem Inhalt.

[23]

Die aktuellen Erfahrungen sind sehr positiv und wir rechnen noch Ende Juni mit einer überarbeiteten Version, die dann in eine flächendeckende Pilotierung in den beiden Bundesländern Hessen und Baden-Württemberg münden soll.

[24]

Dabei ist dieses Projekt nicht einmalig, es gibt bereits Konkurrenzentwicklungen. Die Besonderheit liegt jedoch in der Einfachheit der Ansteuerung. Das Projekt JANO kann praktisch von jedem WORD-Dokument beziehungsweise PDF-Dokument auf einem zentralen Server angesteuert werden, so dass es unabhängig vom E-Akten System funktioniert, das in dem jeweiligen Bundesland eingesetzt wird. Diese Anforderung macht es extrem einfach kompatibel für den Einsatz auch in anderen Bundesländern, aber auch in der bereits erwähnten Justizcloud. Dies bleibt auch das Ziel: die Entwicklung eines Tools, das nach kurzer Zeit bereits für alle Bundesländer zur Verfügung stehen kann.

[25]

Diese beiden vorgestellten KI-Projekte sind nicht die einzigen. In Niedersachsen gibt es das Projekt MAKI, Bayern und Nordrhein-Westfalen experimentieren ebenfalls bereits erfolgreich mit ersten Anwendung, Baden-Württemberg betreibt auf einer ähnlichen Plattform wie FRAUKE das Projekt OLGA bei dem Oberlandesgericht Stuttgart. Das Bundesministerium der Justiz hat Anfang Juni mitgeteilt, dass es mehrere KI-Projekte der Bundesländer mit einem zweistelligen Millionenbetrag fördern will.

[26]

Dies alles zeigt, dass viele Akteure aktuell am Testen sind, zu einem flächendeckenden Einsatz ist allerdings bisher noch kein Projekt in der deutschen Justiz gediehen.

[27]

Dies wird die nächste Herausforderung sein, aus Pilotanwendungen müssen (endlich) flächendeckende Anwendungen werden.

[28]

Die Akzeptanz fast aller Projekte in der Richterschaft ist sehr hoch. Gerade jüngere Richterinnen und Richter, aber auch die Rechtspflegerschaft erwarten bereits, dass solche Tools zur Bearbeitung von Massenverfahren seitens der Justizverwaltung zur Verfügung gestellt werden. Diese Verwaltungen stehen jedoch vor den dargestellten betrieblichen Problemen und auch der fehlenden Entwicklungskapazität in den landeseigenen IT Stellen. KI bleibt Hightech und dafür erscheint der Einsatz von professionalisierten IT-Dienstleistern momentan schlicht erforderlich.

[29]

Die Chancen, die sich aus den Anwendungen für die gerichtliche Praxis ergeben, sind sehr gross und wir sollten diese Entwicklung auch grundsätzlich begrüssen. Gerichtliche Urteile bleiben Menschenwerk, sie werden auch durch den Einsatz von KI-Tools nicht zu automatisierten Urteilen. Der «RoboJudge» kann nicht das Ziel sein und er wird auch nicht kommen.

[30]

Der sinnvolle und massvolle Einsatz von KI in der deutschen Justiz ist ein Zukunftsprojekt der nächsten Jahre und es ist sehr schön zu sehen, dass die kleinen Pflänzchen der KI-Anwendungen sich immer weiter in der bundesdeutschen Justizlandschaft ausbreiten.


Frank Richter, LL.M., Präsident des Landgerichts, Richter am Staatsgerichtshof des Landes Hessen.