Jusletter IT

Mehr Semantik für die juristischen Datenbanken der EU?

  • Author: Pascale Berteloot
  • Region: Luxembourg
  • Field of law: Applications
  • Collection: Festschrift Erich Schweighofer
  • Citation: Pascale Berteloot, Mehr Semantik für die juristischen Datenbanken der EU?, in: Jusletter IT 22 February 2011
Für Ihre juristischen Datenbanken, die vom Amt für Veröffentlichungen verwaltet werden, hat die Europäische Union mit ersten Bausteinen auf dem Weg zu mehr Semantik begonnen. Es handelt sich um die Erneuerung der Verwaltung des Thesaurus Eurovoc und der Arbeit an einer Standardisierung der Metadaten. Die Übernahme durch das Amt der Zusammenfassungen der EU-Gesetzgebung wird die Semantik weiter anreichern können. Alle Projekte berücksichtigen die 23 Amtssprachen der EU.

Inhaltsverzeichnis

  • 1. Einleitung
  • 2. Die Erneuerung des Eurovoc Thesaurus1
  • 3. Das «Record» Projekt
  • 4. Die Zusammenfassungen der EU-Gesetzgebung
  • 5. Schlusswort

1.

Einleitung ^

[1]
Die juristischen Datenbanken der EU, die vom Amt für Veröffentlichungen der EU verwaltet werden, haben nun eine mehr als dreißig jährige Geschichte und waren bei ihrer Entstehung durch eine starke dokumentarische Komponente gekennzeichnet, die stets beibehalten wurde. Dies bedeutet, dass einheitlich seit Anbeginn für jeden Rechtsakt, der in die Datenbanken eingegeben wird, ein vollständiger Satz von Metadaten entsteht, der es erlaubt, sowohl das Recht, das unter moderneren technischen Gegebenheiten entstanden ist, wie auch ältere historische Schichten des Europäischen Rechts zur Verfügung zu stellen.
[2]
Damit sind die Datenbanken der EU in der glücklichen Lage einen Kern auf dem Weg zu mehr Semantik schon zu besitzen. Dieser Kern erlaubt es, die Abfrage vielfältig zu gestalten und auch in der Zukunft, den stets wachsenden Erwartungen der Benutzer anzupassen. Dazu kann das bestehende Instrumentarium dank Entwicklung der Technik gewinnbringend eingesetzt werden.
[3]
Nun hat diese lange Geschichte auch ihre Kehrseiten, unter anderem die Tatsache, dass es unmöglich ist über Jahre gleiche Methoden der Metadaten Erstellung zu sichern. Die menschlichen Entscheidungen sind auch von der jeweiligen historischen Sichtweise geprägt. Von der vollkommenen Handarbeit zur teilweisen Automatisierung ist es noch ein langer Weg.
[4]
Drei Projekte der neueren Entwicklung der Datenbanken bringen diese ein Stück weiter auf dem langen Weg zu mehr Semantik. Sie betreffen allesamt ein besserer Einsatz des Vorhandenen. Es handelt sich um die Erneuerung des Eurovoc Thesaurus, um ein «Record» genanntes Projekt zur Standardisierung von Metadaten und um die Übernahme durch das Amt für Veröffentlichungen der Zusammenfassungen der EU Gesetzgebung.

2.

Die Erneuerung des Eurovoc Thesaurus1 ^

[5]
Eurovoc ist ein ursprünglich vom Europäischen Parlament entwickelter Thesaurus, der alle Tätigkeitsbereiche er Europäischen Union erfasst. Er ist in 21 Domains mit 127 Microtheauri unterteilt. Eurovoc besteht in allen offiziellen Sprachen der EU bis auf Irisch und in einigen weiteren Sprachen, von denen Kroatisch und Serbisch auch durch das Amt zugänglich gemacht werden, während Baskisch, Katalanisch und Russisch durch Links erreicht werden. Eurovoc beinhaltet 6 800 Begriffe.
[6]
Im Jahr 2006 war die Überholung des gesamten Systems schon lange überfällig und es begann ein Projekt zur Neuentwicklung der technischen Infrastruktur. Da Eurovoc unter freien Lizenzen zahlreiche Benutzer außerhalb der Institutionen der EU findet und die Kontakte zwischen verschiedenen Thesauri vornehmlich internationaler Organisationen sich intensivierten, erschien es gleichzeitig angebracht, eine Methode zumMapping zu entwickeln, um die Interoperabilität zwischen Thesauri herzustellen..
[7]
Dieses Projekt fand seinen Abschluss in einer vom Amt in Luxemburg veranstalteten Konferenz im November 20101 und in der Eröffnung der neuen Eurovoc Seite2 . Im Hinblick auf semantische Entwicklungen ist besonders die gewählte Architektur hervorzuheben, die außer den ISO-Normen OWL und XML implementiert und den Inhalt in XHTML, SKOS, RDF verfügbar macht.
[8]
Eine neue Version des Thesaurus (Eurovoc 4.4) wird on line im Laufe des ersten Halbjahres 2011 erscheinen und alle durch das Inkrafttreten des Vertrags von Lissabon notwendig gewordenen Änderungen enthalten.

3.

Das «Record» Projekt ^

[9]
Auch wenn die vom Amt für Veröffentlichungen verwalteten Systeme reich an Metadaten sind, stellt sich in einer sich semantisch entwickelnden Umwelt verstärkt die Frage nach der Interoperabilität.
[10]
In dieser Hinsicht hat die EU Kommission 2008 nach einigen Studien im Rahmen von e-Governement die SEMIC.EU Initiative gestartet, deren Ziel es ist, auf Europäischer Ebene eine gemeinsame Plattform zu bieten, zur Information und zum Austausch, sowie zur Speicherung und zur Verfügung Stellung von semantisch relevanten Inhalten der öffentlichen Verwaltungen3 .
[11]
Auf der Ebene des Amtes ist das Ziel des «Record» genannten Projekts, ein zentralisiertes Metadaten System aufzubauen, das zunächst für die eigenen juristischen Datenbanken gelten wird, sich aber auch auf juristische Datenbanken anderer Institutionen der EU erstrecken kann und jedenfalls auch auf andere vom Amt verwaltete Systeme angewendet wird. Es geht also darum, für die bisher 600 identifizierten Elemente der in den heutigen Systemen des Amtes befindlichen Metadaten, einheitliche Schemata zu entwickeln, die zur Interoperabilität beitragen sollen. Die Tabellen dieser Schemata werden zu einem Referenzmodell, mit Codes und Labels für alle Sprachversionen. Ein mit den Systemen zur Erstellung und Verwaltung von Metadaten in Verbindung stehendes Metadaten Register soll zur Referenz für die Beschreibung aller Dokumente und Objekte der Datenbanken werden.
[12]
Während die Definition einiger Referenzcodes und -labels sehr schnell und in einem halb automatisierten Prozess ergehen konnte, ist bei dem Reichtum an Metadaten der jetzigen Datenbanken, die, wie schon erwähnt, nicht einheitlich entstanden sind, die Definition anderer in allen amtlichen Sprachen eine sehr langwierige und hoch spezialisierte Arbeit, die viel Ressourcen in Anspruch nimmt. Die Erstellung neuer, besserer Datenmodelle wird auch nach einem allgemeinenMapping mühsame Anpassungen der existierenden Metadaten erfordern. Es handelt sich jedenfalls um ein zukunftsträchtiges Projekt, das aber erst in einigen Jahren für den Benutzer ersichtlich seine Früchte tragen wird.

4.

Die Zusammenfassungen der EU-Gesetzgebung ^

[13]
Die Zusammenfassungen der EU-Gesetzgebung4 werden schon seit langen Jahren dem Bürger zur Verfügung gestellt. Sie heben die wichtigsten Aspekte der EU-Gesetzgebung in allen Bereichen seiner Tätigkeiten hervor. Sie sollen in einer einfachen, leicht verständlichen Sprache dem Bürger das EU-Recht näher bringen. Nachdem die Verwaltung des Systems seit Anbeginn bei der Kommission lag, wird es graduell bis 2012 dem Amt übergeben.
[14]
Außer der Aufgabe, das Informationssystem weiterzuführen, hat sich das Amt u.a. vorgenommen, dieses besser mit den bisher verwalteten Datenbanken mit offiziellen Akten zu verlinken und fehlende Sprachversionen nachzuliefern.
[15]
Die Übernahme eines solchen Systems zur Ergänzung der schon bisher verwalteten Datenbanken öffnet aber auch neue Perspektiven. Wenn bisher die Aufgabe des Amtes darauf beschränkt war, Texte zu veröffentlichen oder der Öffentlichkeit zugänglich zu machen, auf die es keinen Einfluss haben konnte, sind die Zusammenfassungen eine redaktionelle Arbeit, die zwar stark vom beschriebenen Rechtsakt abhängt, jedoch eine gewisse sprachliche Freiheit zulässt.
[16]
Die Indexierungen der Datenbanken mögen in den jeweiligen Amtssprachen noch so gut funktionieren, sie tragen nicht den lexikalen Verschiebungen Rechnung, die die EU-Begrifflichkeit erfährt, wenn sie im nationalen Recht rezipiert wird. Am ehesten findet sich dieses besser auf die nationalen Traditionen abgestimmtes Vokabular in der Sprache der Abgeordneten am Europa-Parlament wieder, deren Fragen jedoch nicht mehr im Volltext in den juristischen Datenbanken übernommen werden. Gerade die Übernahme durch das Amt eines sprachlich flexibleren Systems, auf das das Amt sprachlich einen Einfluss hat, kann es erlauben, in den jeweiligen Sprachfassungen, nationale sprachliche Eigenheiten im Berech des Rechts der EU zu berücksichtigen, die nicht ohne weiteres technisch erfasst werden können.
[17]
Diese sprachliche Erweiterung, d.h. die Integrierung von in den Mitgliedstaaten gebräuchlichen Bezeichnungen für Begriffe aus dem EU-Recht zusammen mit der Verlinkung der bürgernäheren Zusammenfassungen mit den Inhalten offizieller Datenbanken, wird entscheidend dazu beitragen, dass die Suchergebnisse sich verbessern.

5.

Schlusswort ^

[18]
Sinn dieses Kurzbeitrags war aus der Praxis von drei laufenden Projekten zu berichten, die die juristischen Datenbanken der EU ein Stück weiter auf dem langen Weg der semantischen Erschließung von Inhalten führen werden. Es handelt sich um einzelne Bausteine, die hier nur aus der Sicht der Inhalte beschrieben wurden. Erneuerungen der technischen Infrastruktur werden parallel durchgeführt.



Pascale Berteloot, Abteilungsleiterin im Amt für Veröffentlichungen der Europäischen Union, 2, rue Mercier, 2985 Luxembourg, LU,pascale.berteloot@publications.europa.eu


  1. 1 Die Eurovoc Seite bietet nun einen Zugang zu allen Konferenzpapieren. Eine Veröffentlichung ist im Laufe des Jahres 2011 geplant.
  2. 2 Die umfassende Vorstellung des Thesaurus bei dieser Konferenz befindet sich unterhttp://eurovoc.europa.eu/drupal/sites/all/files/conference2010/EuroVoc%20path%20semantic%20web%2020101118.ppt
  3. 3 Für mehr Information zur SEMIC.EU Initiative, siehe unterwww.semic.eu/semic/view/index.xhtml
  4. 4 Siehe unterhttp://europa.eu/legislation_summaries/index_de.htm