Jusletter IT

Benutzerspezifische Transparenz von Rechtsdokumenten

  • Authors: Harald Hoffmann / Friedrich Lachmayer
  • Category: Articles
  • Region: Austria
  • Field of law: Rechtsinformation & Juristische Suchtechnologien
  • Collection: Tagungsband IRIS 2014
  • Citation: Harald Hoffmann / Friedrich Lachmayer, Benutzerspezifische Transparenz von Rechtsdokumenten, in: Jusletter IT 20 February 2014
Durch Zerlegen eines Dokuments in logische Einheiten und deren Abbilden auf XML-Fragmente lässt sich der Zugang auf jede einzelne Einheit an individuelle Rechte knüpfen. Ein Nutzer sieht dann ein virtuelles (auch: synthetisches) Dokument, das genau aus jenen Teilen besteht, die zu lesen er berechtigt ist. Die authentische geltende Fassung publizierten Rechts wird möglich. Betrachtet man ein Dokument als dynamischen Datenbankauszug und fügt Elemente des Workflow hinzu, verlässt das Dokument die Ebene von Papier und Publizieren und wird zu einem kontextspezifischen Informationselement, das einen Schritt in Richtung auf die Automatisierung der Verarbeitung textueller Information ermöglicht.
[1]

Im üblichen Verständnis eines Computer-Nutzers entspricht ein Dokument einer Datei. Die Datei ist die dokumentalistische Einheit. Das technische Substrat mag dann ein Format sein. Es wundert nicht, dass viele Leute automatisch an eine Datei im PDF-Format (Portable Document Format) denken, wenn sie von einem Dokument sprechen. Speichert man ein Dokument oder fragt dieses ab, hantiert man immer mit einem Dokument als Ganzem. Schließlich war ja ein juristisches Dokument auch immer eine Einheit, abgebildet in einen mehr oder minder dicken und gebundenen Stapel Papier. Was weiter unten das virtuelle Dokument ist, ist hier die elektronische Abbildung einer dokumentalistischen Einheit (Abbildung 1).

Abbildung 1: Fall einer dokumentalistischen Einheit als Ganzes: die Abfrage liefert die 1:1-Abbildung

[2]

Ein Dokument ist aber nur im einfachsten Fall ein Ganzes. Dokumentalistisch gesehen kann es aus mehreren Komponenten bestehen, nämlich aus dem Dokument selbst und seinen Anlagen (Materialien usw.). Weitere Komponenten sind die verschiedenen zeitlichen Versionen. Für jeden Zeitpunkt wird es wohl spezifische begleitende Materialien geben, z.B. Kommentare zu Änderungen. Jede dieser dokumentalistischen Komponenten kann zusätzlich ein unterschiedliches technisches Substrat haben. In einer Metapher gesprochen, sind alle diese Komponenten in einer großen Mappe enthalten (Abbildung 2).

Abbildung 2: Das virtuelle Dokument erlaubt den Blick hinein in eine Mappe mit Information

[3]
Die Mappe darf nicht verwechselt werden mit dem gesamten Inhalt eines Informationssystems z.B. für Judikatur, Gesetze oder andere «Dokumente». Ein derartiges Informationssystem ist in der hier verwendeten Terminologie die Summe aller «Mappen», implementiert z.B. in einer Datenbank. Ein Beispiel für eine Mappe ist die «geltende Fassung» eines Gesetzes in RIS, dem Rechtsinformationssystem des Bundes, oder auch eine Zeitscheibe – die Fassung des Gesetzes zu einem bestimmten Zeitpunkt.
[4]

Generell sei eine «Mappe» hier als Rechtsdokument mit all seinen Komponenten verstanden – synonym für ein «(verallgemeinertes) Dokument». In diesem Sinne konzentrieren sich die folgenden Ausführungen auf den Blick in die Mappe hinein. Die Mappe in einem Informationssystem zu suchen und zu finden entspricht dem Suchen und Finden eines Dokuments in der einfachsten Form eines solchen Informationssystems (Abbildung 1) und wird hier nicht weiter betrachtet.

[5]

Ein virtuelles Dokument erlaubt den Blick in diese Mappe hinein. Dieser Blick vermittelt den Eindruck des Inhalts als ein Ganzes, also eines vollständigen Dokuments. Den Eindruck dieses Ganzen nennt man «virtuelles» Dokument (Abbildung 2). Es erweckt den Anschein, ein physisches Dokument bzw. eine dokumentalistische Einheit zu sein.

[6]

Die Virtualität bietet die Möglichkeit, unterschiedliche Sichten auf die vorhandenen Komponenten (die vorhandene Information) in der Mappe zu liefern. Diese Möglichkeit wirkt in zwei Richtungen:

  • in die Richtung zum Nutzer: dieser kann seinen Blick in die Mappe (im Rahmen der vorhandenen Information) erweitern oder fokussieren. Ziel ist, möglichst relevante Information aus der Mappe zu erhalten, also einen Extrakt, nicht nur – wie heute weitgehend üblich – nur «das Ganze» im Sinne von  Abbildung 1.
  • in die Richtung zum Eigentümer der Information: dieser kann Benutzerprofile anlegen, als deren Folge Nutzer mit unterschiedlicher Berechtigung auf dieselbe Abfrage unterschiedliche Ergebnisse sehen – stets als integres Dokument, dem man nicht ansieht, dass in der Mappe weitere Information liegt. So lassen sich beispielsweise in der Mappe Komponenten, die im gerichtlichen Entscheidungsverfahren nicht öffentlich sind, dem allgemeinen Zugriff entziehen (Abbildung 3).
[7]

Abbildung 3: Dieselbe Abfrage liefert ja nach Benutzerprofil unterschiedliche Resultate

[8]

Weiter oben schon wurde erwähnt, dass man den Blick in die Mappe erweitern oder fokussieren kann. Von besonderem Interesse ist das Fokussieren, denn dieses erlaubt die Abkehr von der heute üblichen Suche, die nur ganze Dokumente als Treffer liefert. Sieht man das Dokument als Mappe, kann man aus dem Dokument gleich die relevanten Teile als Suchergebnis liefern – wenngleich zunächst nur mit der Granularität der Teile (Fragmente) des Dokuments (Abbildung 4).

Abbildung Abbildung 4: Besteht ein Dokument aus «Fragmenten», lassen sich diese als Ergebnis einer Abfrage liefern. Gegenüber ganzen Dokumenten als Treffer lässt sich die Granularität im Grade der Fragmentierung erhöhen.

[9]
Man kommt zur Frage der Transparenz von Information. Egal, wie man diese sieht – das virtuelle Dokument erlaubt, diese zu gestalten. Diese Flexibilität ist der Hauptvorteil eines virtuellen (auch: synthetischen oder auch: dynamischen) Dokuments gegenüber einem physischen (auch: statischen), wie es z.B. ein PDF-File ist. Diese Flexibilität ist eine Folge der Feinstruktur eines Dokuments, abgebildet in z.B. XML-Fragmenten.
[10]
Diese Flexibilität erlaubt, z.B. bereits beim Erstellen eines Dokuments festzulegen, welche Information für wen zugänglich sein soll. Ein Beispiel ist, personenbezogene Information in der Judikatur für öffentliche Nutzer auszublenden («Ex-ante-Schwärzen»). Ein anders ist, in kommerziellen Datenbanken Kommentare des Legisten zu Rechtstexten nur Subskribenten zugänglich zu machen. Die einer bestimmten Berechtigung entsprechenden XML-Fragmente werden für einen Nutzer dynamisch zu einem Gesamtdokument zusammengesetzt, das ihm stets den Eindruck der Transparenz vermittelt – Transparenz im Sinne der Vollständigkeit. Dieser Eindruck lässt sich für jeden Nutzer anders gestalten, wenn man das so will.
[11]
Das virtuelle Dokument erlaubt noch einen anderen benutzerfreundlichen Ansatz: die Strukturierung eines Dokuments entsprechend der Ontologie der Abfrage. Man kommt weg von der antiquierten Datenbankmaske, wie sie derzeit Rechtsinformationssysteme gerne verwenden. Man kommt weg von Google und den bekannten Grenzen der Volltextsuche. Um ein Missverständnis zu vermeiden – über das nach der Ontologie der Abfrage strukturierte Dokument ist man der semantischen Abfrage wohl einen Schritt näher, hat diese aber noch nicht erreicht.
[12]
Die Struktur eines Dokuments manuell einer Ontologie anzupassen, ist aufwändig. Besser verwendet man dazu ein geeignetes Tool. Dass ein solches Tool machbar ist, zeigt der «Ontology Explorer», der als Prototyp im Rahmen von zwei FP6-Projekten entwickelt und an RISv3 demonstriert wurde.
[13]
Zurück zur Transparenz im Sinne der Vollständigkeit. Man kann im Sinne der Vollständigkeit auch allen Nutzern denselben Eindruck vermitteln, wie das z.B. bei RIS heute geschieht. RIS nützt das virtuelle Dokument auf eine andere Weise, nämlich um Zeitschichten der Information zu liefern.
[14]
Das virtuelle (oder: synthetische) Dokument bei RIS ist die geltende Fassung, synthetisiert aus den Paragraphendokumenten. Bei der geltenden Fassung werden die aktuellen Paragraphen aneinander gereiht. Beim Herstellen einer Zeitschicht nimmt man die Paragraphen in der richtigen historischen Version. Würde man RIS nicht nur für die Ex-post-Dokumentation verwenden, sondern auch zum Novellieren der Gesetze (Schlagwort «Tasmanien»), ließen sich auch jene künftigen Versionen darstellen, an denen der Legist gerade arbeitet. Das können durchaus mehrere zur gleichen Zeit sein. Das synthetische Dokument würde somit auch die technische Voraussetzung dafür schaffen, den legistischen Produktionsprozess neu zu gestalten.
[15]
Koppelte man die Fragmente nicht nur mit Zeit-, sondern auch mit Sicherheitsattributen, wären zusätzliche Veränderungen im Produktionsprozess der Dokumente denkbar. Ein Beispiel wäre, dass man sich die unterschiedlichen Versionen derselben Judikaturdaten ersparen könnte (z.B. publiziert RIS derzeit eine eigens für die Publikation erstellte Version). Ein anderes Beispiel wäre, sich das Ex-post-Schwärzen personenbezogener Daten zu sparen (Aufwand, fehleranfällig). Im synthetischen Dokument scheinen die geschwärzten Stellen nicht auf bzw. sie sind sinnvoll gefüllt.
[16]
Es ist schwierig genug, einem elektronischen Dokument denselben rechtlichen Status zu geben wie einem Papierdokument. Bei der authentischen Rechtspublikation ist das gelungen – auf Basis nichtfragmentierter Dokumente. Technisch lässt sich die Authentizität allerdings auch auf ein fragmentiertes und synthetisch zusammengesetztes Dokument abbilden. Folge wäre z.B. die Möglichkeit einer authentischen geltenden Fassung eines Gesetzes – Weltneuheit, aber rechtliches Neuland, das erst auf den Status des Papierdokuments zu heben wäre. Ein Prototyp für ein derartiges System wurde im Zuge der bereits erwähnten zwei FP6-Projekte unter dem Namen RISv3 entwickelt.
[17]
Virtuelle (oder: synthetische) Dokumente lassen sich auch außerhalb der «reinen Rechtsinformation» denken. Dazu braucht man sich nur vorzustellen, dass die Information in einer Datenbank liegt, und dass das Dokument das Ergebnis einer spezifischen Datenbankabfrage ist. Ein aktuelles Beispiel ist die elektronische Patientenakte. Diese lässt sich – ungeachtet der derzeitigen Implementierung – theoretisch als virtuelles Dokument generieren (synthetisieren) und dann sogar ausdrucken, womit sie zu einen Papierdokument der üblichen Form geworden wäre.
[18]
Tatsächlich können die Elemente der Patientenakte in unterschiedlichen Formaten und sogar mit interschiedlicher Terminologie (aber hoffentlich mit einer gemeinsamen Semantik) auf unterschiedlichen Systemen liegen, in unterschiedlicher Verantwortung, aber stets unter der Kontrolle des Patienten. Sieht man davon ab, dass ein derartiges System eine rechtliche, technische und semantische Herausforderung ist, lässt sich jede Sicht auf die Patientendaten als spezifisches synthetisches Dokument interpretieren: es wird – vereinfacht ausgedrückt – eine Arztsicht, eine Apothekensicht, eine Notfallaufnahmesicht usw. geben. Jede Sicht lässt sich mit einer spezifischen Berechtigung synthetisch und online aus verteilten XML-Fragmenten erzeugen. Volle Transparenz – das heißt, die Gesamtsicht auf alle Patientendaten – und Verfügungsgewalt hat nur der Patient. Sollte er zumindest.
[19]
Die Dynamik des synthetischen Erzeugens erlaubt zusätzlich, auch Elemente des Workflow zu berücksichtigen – es lassen sich Freigaben oder «chefärztliche Bewilligungen» einbauen, um einmalig und nicht als generelle Freigabe an speziell sensitive Daten zu kommen. Man verlagert die unsichere Mensch-Maschine-Kommunikation zur sicheren (da fest programmierten und jederzeit überprüfbaren) Maschine-Maschine-Kommunikation. Auch derartige systemübergreifende Verkettungen von Abläufen zum Synthetisieren von Information wurden in den erwähnten FP6-Projekten bereits demonstriert, und zwar am Beispiel des europäischen Haftbefehls. Die erwähnten Freigaben kamen in diesem Fall von einem oder mehreren Richtern. Heute würde man noch das Element der Verschlüsselung hinzufügen.
[20]
Die technischen Voraussetzungen zum Erzielen der nutzerspezifischen Transparenz lassen sich auf Basis der Fragmentierung der Information vor allem mit XML-Fragmenten und deren Zusammenbau in virtuellen (synthetischen) Dokumenten schaffen. Herausforderungen bleiben die Syntax (z.B. einheitlicher Aufbau von Gesetzen) und die Semantik (z.B. die Bedeutung von Rechtsbegriffen) – wenn man nicht nur beim Menschen bleiben will, der Rechttexte in guter juristischer Tradition lesen und interpretieren muss, sondern jetzt auch einen Teil automatisch weiterverarbeiten will. Hier steht man heute noch ganz am Anfang.

 

Harald Hoffmann

1Senior Consultant für Rechtsinformation bei METADAT GmbH

Simmeringer Hauptstraße 24; 1110 Wien, AT

harald.hoffmann@metadat.com; http://www.metadat.com/

 

Friedrich Lachmayer

Professor an der Universität Innsbruck

Tigergasse 12, 1080 Wien, AT

Friedrich.Lachmayer@uibk.ac.at