Jusletter IT

Juristische Thesauri und Rechtssprache

  • Author: Erich Schweighofer
  • Category: Articles
  • Region: Austria
  • Field of law: Law and Language
  • Collection: Tagungsband-IRIS-2013
  • Citation: Erich Schweighofer, Juristische Thesauri und Rechtssprache, in: Jusletter IT 20 February 2013
Ein Thesaurus ist als Abstraktion vom Textkorpus derzeit die beste Möglichkeit, die vielschichtigen Besonderheiten der Rechtssprache zeitnah und in ausreichender Ver-einfachung abzubilden. In der Wissensakquisition kommt der (semi)automatischen Textanalyse die entscheidende Rolle zu. Dadurch werden der Aufbau und die War-tung dieser Begriffswelten wesentlich erleichtert und verbessert.

Inhaltsverzeichnis

  • 1. Einleitung
  • 2. Rechtsprache
  • 3. Rechtsdokumentation und Strukturanalyse des Rechts
  • 4. Thesaurus
  • 5. Forschungsstand und Weiterentwicklung
  • 6. Schlussfolgerungen

1.

Einleitung ^

[1]

Das Recht ist nach wie vor textdominiert. Durch die benutzerfreundliche, stabile und effiziente Lösung juristischer Informationssysteme als Textspeicher, Archiv und Suchhilfe ist nunmehr ein riesiger Textkorpus vorhanden1. Die Frage der Strukturierung dieser Textsammlung bleibt eine wichtige Forschungsfrage. Der Textkorpus bietet eine unerschöpfliche Quelle für rechtslinguistische Forschungen. Das Semantic Web2 brachte eine stärke Fokussierung der Forschung auf semantische Indexierung. Dieses Thema ist Kern der Rechtsinformatik seit vielen Jahren: die Frage nach der besten und zweckmäßigsten Formalisierung des Rechts zwecks computergestützter Verarbeitung, sei es mit logischen, begrifflichen oder anderen, insb. sprachbezogenen Formalisierungen. Seit vielen Jahren sind Ontologien ein Ansatz zur expliziten Beschreibung von Konzepten3. Dieser Ansatz kann mit der viel älteren und traditionellen Thesaurusforschung kombiniert werden. Der Thesaurus ist als vereinfachte Form einer Ontologie wesentlich einfacher zu handhaben.

2.

Rechtsprache ^

[2]

Die Sprache ist das Werkzeug der Juristen. Die Notwendigkeit eines möglichst exakten und eindeutigen Ausdrucks hat zu einem hohen Abstraktionsgrad geführt. Die Rechtssprache ist durch eine komplexe und präzise Begrifflichkeit mit vielen besonderen Wörtern und Wendungen gekennzeichnet. Ohne Beherrschung dieser Begrifflichkeit ist eine juristische Arbeit nahezu unmöglich.4 Durch die IT sind textbasierte Information Retrieval-Systeme Standard geworden, womit ein gutes Potential für computer-linguistische Methoden gegeben ist. Die Rechtslinguistik hat sich in den letzten Jahren wesentlich weiterentwickelt und bietet nunmehr eine wesentliche Unterstützung für den Aufbau eines Rechtsthesaurus bzw. zu einem späteren Zeitpunkt für die Rechtsontologie.

3.

Rechtsdokumentation und Strukturanalyse des Rechts ^

[3]
Der Einsatz von Information Retrieval-Systemen ist ein Meilenstein in der Rechtsdokumentation. Internet und mobile Telekommunikation haben den einst restriktiven Zugang für (fast) alle und zwar (fast) überall ermöglicht. Apps stellen einen weiteren wesentlichen Schritt zum benutzerfreundlichen Zugang zum Recht dar. Die Sichtung und Strukturierung des jeweiligen Textkorpus einer Rechtsordnung hat sich hingegen wenig verändert. Nach wie vor sind die traditionellen Techniken der Rechtsdokumentation und Rechtsdogmatik dominant; erstere sind aber durch die IT-Methoden wesentlich effizienter geworden.5
[4]
Die Strukturierung von Textkorpora ist nichts Neues, sondern ein ständiges Bemühen der Rechtsdokumentation und Rechtsdogmatik. Neu sind jedoch die IT-Werkzeuge des Semantic Web, die zu einer wesentlichen Erleichterung solcher Forschungen beigetragen haben. Dies gilt einerseits für die Wissensrepräsentation, andererseits für die Wissensakquisition und Wiederverwendung von Wissen.
[5]
Die Sprache steht im Vordergrund der Strukturierung. Für die Rechtsdogmatik ist dies evident. Ziel der Rechtsdogmatik ist die systematische und begriffliche Durchdringung der geltenden Rechtsnormen durch Interpretation und Systembildung. Der Textkorpus der Rechtsquellen wird in ein System von Rechtsprinzipien und Regeln übergeführt. Die Begriffe werden in einem Wechselspiel von Abstraktion und Applikation geklärt und möglichst praxistauglich definiert. Der Anspruch der Rechtsdogmatik zielt auf eine vollständige Repräsentation des jeweiligen Wissensgebietes; die Rechtsdokumentation begnügt sich mit Bereitstellung der Quellen und Verbesserung des Zugangs zu diesen. Instrumente sind Wörterbücher, Lexika, Enzyklopädien, Dokumentationssprachen etc. Neben der Qualität der jeweiligen Definitionen ist die Darstellung der Beziehungen die wesentlichste Herausforderung. Dokumentationssprachen (Klassifikationen und Thesauri) sind bekannte Werkzeuge der Wissensrepräsentation und Indexierung. Ein Zitat (Verweis) ist eine Referenz auf ein Dokument bzw. einen Teil dieses Dokuments und zeigt die Beziehungen im Textkorpus. Die Fülle der Relationen zwischen juristischen Dokumenten im Stufenbau der Rechtsordnungen werden mittels eindeutiger Dokumentenidentität (z.B. CELEX-Nr. oder URI) dargestellt und reflektieren – unter anderem – die Bedeutung rechtlicher Autoritäten. Hypertext hat diesen dokumentarischen Methoden gewissermaßen «Flügel verliehen» und die Nutzung wesentlich erleichtert. Heute wird dies als Hinzufügung von Metadaten (d.h. nicht-linearen Strukturen) zu an sich linearen Texten gesehen.6
[6]

Der Thesaurus liefert das Grundgerüst für die Ontologie: ein System der Rechtsbegriffe als Beschreibung des Rechtssystems. Die bereits bestehenden Begriffshierarchien und Relationen müssen weiter ausgebaut und ergänzend mit Attributen versehen werden. Aber auch die anderen Bemühungen zur Strukturanalyse im Recht können (teilweise) als Grundlage für die Entwicklung von Ontologien angesehen werden. Die Herausforderung für juristische Ontologien ist die Brückenbildung zwischen formaler Logik, welche für automatisierte Rechtsanwendungen erforderlich ist, und der klassischen Begriffslogik. Ontologien sind eine explizite formale Spezifikation einer gemeinsamen Konzeptualisierung7. Kern jeder juristischen Ontologie ist die Beschreibung der realen Welt (des Weltwissens) sowie des Rechtssystems. Die Vernetzung der Begriffswelten des Weltwissens und des juristischen Wissens ist eine Zentralaufgabe der Ontologie. Begriffe, Typen, Instanzen und Klassen werden durch Relationen und Vererbung zur formalen Beschreibung und Darstellung der Beziehungen zwischen diesen Objekten verwendet. Thesauri und lexikalische Ontologien basieren auf gleichen Grundlagen; lexikalische Ontologien verwenden eine erweiterte Typologie der Beziehungen und machen dieses Wissen für IT-Anwendungen nutzbar.

[7]
Die Wissensakquisition ist nach wie vor sehr arbeitsintensiv und es gibt viele Bemühungen, diese durch (semi)automatische Methoden zu ergänzen bzw. zu ersetzen. Der Textkorpus wird mit linguistischen Methoden erforscht und man möchte Wissen bzw. Wissenselemente extrahieren bzw. im besten Fall durch Interpretation und Analogie gewinnen.
[8]

Für das semantische Web hat das W3C die technischen Grundlagen für die Formalisierung von Text, Sprache, Thesaurus und Ontologie geschaffen.8

[9]
Die Strukturierung und Analyse von juristischen Textkorpora ist sehr zeitintensiv und bedarf hochqualifizierter Experten. Jede IT-Unterstützung ist natürlich willkommen und wird in der Rechtsdokumentation standardmäßig genutzt. Auch für den Aufbau von Ontologien werden formale rechtslinguistische Methoden zunehmend eingesetzt. Zum jetzigen Zeitpunkt ist es jedoch besser, sich auf den Aufbau von einfachen Ontologien – Thesauri – zu konzentrieren. Insbes. die Abbildung der vielschichtigen Relationen ist eine Herausforderung.

4.

Thesaurus ^

[10]
Ein Thesaurus ist eine natürlich-sprachlich basierte Dokumentationssprache mit terminologischer Kontrolle der Begriffe. Im informationswissenschaftlichen Sinne ist ein Thesaurus «eine geordnete Zusammenstellung von Begriffen und ihren (vorwiegend natürlichsprachlichen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient».9
[11]
Aus juristischer Sicht besteht ein Thesaurus aus den jeweiligen Deskriptoren und Relationen zwischen diesen (Äquivalenzrelation für Synonyme und Polyseme, Hyponymie für Über- bzw. Unterordnung, Assoziationsrelation für verwandte Begriffe etc.). Ein wesentlicher Teil besteht aus den Definitionen der Deskriptoren. Die notwendige Verbesserung eines Thesaurus liegt im Aufbau einer verbesserten Typologie der Relationen.
[12]
Das W3C hat mit der formalen Sprache Simple Knowledge Organisation System (SKOS) einen Standard zur Kodierung von Dokumentationssprachen (Thesauri, Klassifikationen, etc.) geschaffen.10 Diese basiert auf dem Resource Description Framework (RDF) und RDF-Schema (RDFS). SKOS dient der Publikation und Wiederverwertung von kontrollierten, strukturierten und maschinenlesbaren Vokabularen.

5.

Forschungsstand und Weiterentwicklung ^

[13]
Die computerbasierte Rechtslinguistik spielt derzeit eine wichtige Rolle in der Unterstützung zum Aufbau und zur Wartung von Thesauri und Rechtsontologien. Begriffe sollen (semi)automatisch aus den jeweiligen Textkorpora generiert und sodann in SKOS übergeführt werden. Die jüngst publizierten Ergebnisse11 zeigen, dass es noch einige Zeit brauchen wird, bis der Wunsch nach einer weitgehend automatisierten Wartung eines Thesaurus Wirklichkeit wird. Sehr gute Ergebnisse werden in der Unterstützung von intellektueller Arbeit erzielt. Begriffsverwendung, -ausprägungen, mögliche Synonyme etc. können wesentlich leichter festgestellt werden. Die Qualität der maschinellen Unterstützung bedarf aber immer noch intellektueller Bewertung und Verfeinerung.
[14]
Die Entwicklung von Thesauri hat großes Potential, weil mit SKOS, (semi)automatischer Textanalyse (z.B. GATE) etc. Werkzeuge bereitstehen, die eine effiziente laufende Kontrolle und Verbesserung des Vokabulars möglich machen.
[15]
In den Tagungsbänden der JURIX bzw. der ICAIL nehmen die Rechtslinguistik und der Aufbau von Thesauri eine immer wichtigere Rolle ein. Diese Entwicklung macht es möglich, Thesauri und Ontologien wesentlich rascher aufzubauen und zu warten. Damit wird eine brauchbare Lösung für das Problem der Wissensakquisition angeboten. Auf das Potential zur Suchunterstützung und Indexierung kann hier nur hingewiesen werden.12
[16]
Bei meinem Projekt des Aufbaus des Dynamischen Elektronischen Rechtskommentars werden derzeit Methoden der formalen Rechtslinguistik eingesetzt, um die Herausforderung der Wissensakquisition beim Aufbau und der Wartung des Rechtsthesaurus besser in den Griff zu bekommen. Es bedarf jedoch noch einiger Verfeinerung der Methoden, damit die Systeme ohne wesentliche intellektuelle Unterstützung die ausreichende Qualität liefern.13

6.

Schlussfolgerungen ^

[17]
Die Beherrschung der Rechtssprache ist und bleibt ein wesentliches Charakteristikum juristischer Qualifikation. Die computergestützte Rechtslinguistik kann hier Unterstützung anbieten. Der Aufbau und die Wartung von Thesauri ist eine sehr lohnende Anwendung, weil dadurch die Begriffswelt des Rechts mit Verlinkung auf die jeweiligen Texte möglichst zeitnah abgebildet werden kann. Methoden der (semi)automatischen Analyse des Textkorpus spielen eine wesentliche Rolle bei der Lösung des Wissensakquisitionsproblems. Die gewonnenen Erfahrungen können sodann zum Aufbau von Ontologien Verwendung finden.

 


 

Erich Schweighofer, Ao. Universitätsprofessor, Universität Wien, Arbeitsgruppe Rechtsinformatik (DEICL/AVR).

 


 

  1. 1 Schweighofer, E., Rechtsinformatik und Wissensrepräsentation, Automatische Textanalyse im Völkerrecht und Europarecht, Forschungen aus Staat und Recht 124, Springer Verlag, Wien (1999).
  2. 2 Berners-Lee, T. et al., The Semantic Web, Scientific American 05/2001, NY, http://www.scientificamerican.com/ (2001).
  3. 3 Schweighofer, E., Indexing as an ontological-based support for legal reasoning. In: Yearwood, J, Stranieri, A. (eds.), Technologies for Supporting Reasoning Communities and Collaborative Decision Making: Cooperative Approaches, IGI Global Publishers, Hershey, PA 2011, S. 213-236 (2011); Sator, G., Casanovas, P., Biasiotti, M.A., Fernández-Barrera, M. (Eds.), Approaches to Legal Ontologies, Springer, Dordrecht (2011).
  4. 4 Deutsche Wikipedia: juristische Fachsprache; Website Rechtslinguistik, http://www.recht-und-sprache.de/index_rl.htm (zuletzt abgefragt 10.2.2013), Grewendorf, G., Rathert, M. Langugage and law – new applications of formal linguistics. In: Grewendorf, G., Rathert, M. (eds.), Formal Linguistics and Law. Mouton de Gruyter, Berlin. S. 1-22 (2009); Rathert, M. Sprache und Recht. Heidelberg, Universitätsverlag Winter (2006); Jackson, P., Moulinier, I., Natural Language Processing for Online Applications, Text Retrieval, Extraction and Categorization, 2nd edition, John Benjamins Publishing Company, Amsterdam (2007).
  5. 5 Vgl. Schweighofer (1999) (FN 1).
  6. 6 Bing, J., Hypertext, Eingeladener Vortrag DEXA (1998).
  7. 7 Breuker, J. et al., Ontologies for legal information serving and knowledge management. In: Proceedings of the 15th Jurix (London, UK, 2002), IOS Press, Amsterdam. S. 73-82 (2002); Schweighofer, E. Indexing as an ontological-based support for legal reasoning. In: Yearwood, J, Stranieri, A. (eds.), Technologies for Supporting Reasoning Communities and Collaborative Decision Making: Cooperative Approaches, IGI Global Publishers, Hershey, PA 2011, S 213-236 (2011); Sator, G., Casanovas, P., Biasiotti, M.A., Fernández-Barrera, M. (Eds.), Approaches to Legal Ontologies, Springer, Dordrecht (2011); Francescioni, E., Montemagni, S., Peters, W., Tiscornia, D. (Eds.), Semantic Processing of Legal Texts, Springer Berlin (2010).
  8. 8 Website: http://www.w3c.org (zuletzt abgefragt: 10.2.2013).
  9. 9 DIN 1463 Teil 1 bzw. ISO 2788:1986 und ISO 25964-1:2011. Vgl. auch Schweighofer (1999) (FN 1), 63 f.
  10. 10 SKOS wurde am 18. August 2009 vom W3C als Empfehlung veröffentlicht. Website: http://www.w3.org/2004/02/skos/ (zuletzt abgefragt: 10.2.2013).
  11. 11 Einen Überblick über die Arbeiten findet sich in Schweighofer (1999) (FN 1); Schweighofer (2011) (FN 3); im Sammelband Grewendorf, G./Rathert, M. (eds.) (2009) (FN 4) sowie jüngst in den JURIX2012 Proceedings: Winkels, R., Hoekstra R., Automatic Extraction of Legal Concepts and Definitions; Wyner, A., Bos, J., Basile, V., Quaresma, P., An Empirical Approach to the Semantic Representation of Laws. Vgl. zur automatischen Klassifikation Kienreich, W., Schulze, G., Lex, E., Rapp, St., Eine Kombination von Regelbasierten und Statistischen Verfahren für die Hierarchische Klassifikation von Juristischen Dokumenten, in diesem Tagungsband (2013).
  12. 12 Vgl. z.B. die Suchunterstützung bei Weblaw (http.///weblaw.ch).
  13. 13 Schweighofer (2011) (FN 3).