Jusletter IT

Herausforderungen für Rechtsdatenbanken im Bereich der Volltextsuche

  • Author: Anton Geist
  • Category: Articles
  • Region: Austria
  • Field of law: Legal Informatics, Legal Information
  • Citation: Anton Geist, Herausforderungen für Rechtsdatenbanken im Bereich der Volltextsuche, in: Jusletter IT 11 September 2014
In den rechercheintensiven juristischen Berufen haben sich Rechtsdatenbanken inzwischen als unabdingbare Hilfsmittel etabliert. Die von ihnen gebotene Möglichkeit der Volltextsuche ist essentiell, bedingt aber bei stetiger Zunahme der verfügbaren Texte sowie zunehmenden Endnutzer/innen-Recherchen auch Herausforderungen. Wie diese aussehen und was getan werden muss um erfolgreiche Recherchen weiterhin zu ermöglichen, beleuchtet der Beitrag überblicksartig.

Inhaltsverzeichnis

  • 1. Juristische Recherche & Rechtsdatenbanken
  • 2. Indexierung und Suche in Rechtsdatenbanken
  • 3. Trügerische Volltextsuche
  • 4. Handlungsempfehlungen
  • 5. Danksagung
  • 6. Literatur

1.

Juristische Recherche & Rechtsdatenbanken ^

[1]

Die juristische Recherche ist ein elementarer und notwendiger Bestandteil der juristischen Praxis. An ihrem Beginn steht typischerweise die Suche nach den für den aktuellen Sachverhalt geltenden Gesetzesbestimmungen, was gerade bei ausgefallenen Rechtsbereichen sowie verstreut geregelten Materien durchaus aufwändig sein kann. Aber auch die zeitlich danach angesiedelte Suche nach einschlägiger Judikatur sowie juristischer Fachliteratur ist in nahezu allen juristischen Tätigkeitsbereichen unverzichtbar.1

[2]

Dieser Recherchefokus der juristischen Berufe verwundert auch nicht, wenn man bedenkt, dass es sich im Bereich der Juristerei um klassische Wissensberufe handelt, «in deren Mittelpunkt die Ermittlung, Anwendung und Kommunikation juristischen Know-hows steht.»2Schweighofer3 bringt es auf den Punkt: «Juristisches Handeln ist primär durch Rechtsinformation bestimmt.»

[3]

Juristische Information Retrieval Systeme – Rechtsdatenbanken – bezeichnet Schweighofer4 als «Meisterleistung der Rechtsinformatik». Seit Jahrzehnten bieten diese – verglichen mit traditioneller Rechtsdokumentation in gedruckter Form – eine vielfach größere Datenmenge auf die unmittelbar elektronisch zugegriffen werden kann, und das mit Suchmethoden, welche über die Möglichkeiten klassischer Register bei Weitem hinausgehen.5 Sogar unabhängig davon wird man inzwischen auch schon alleine vor dem Hintergrund der jährlich anfallenden Zahl an zu beachtenden – und eben jedenfalls auch elektronisch verfügbaren – rechtlichen Texten Staudegger6 zustimmen können wenn sie festhält dass eine Rechtsdatenbank inzwischen «ein universelles und unabdingbares Hilfswerkzeug» sei.

2.

Indexierung und Suche in Rechtsdatenbanken ^

[4]

Technisch gesehen stellen Rechtsdatenbanken Information Retrieval Systeme dar. Ziel solcher Systeme ist es allgemein, «wenig oder gänzlich unstrukturierte Informationen in einer Weise aufzubereiten, dass sie bei einem aktuellen Informationsbedürfnis mit entsprechenden Suchstrategien und -techniken möglichst präzise und vollständig wiederaufgefunden werden können».7

[5]

Betrachtet man zunächst das notwendige Einspielen und Aufbereiten von Dokumenten für die spätere Abfrage(möglichkeit) durch die Benutzer/innen (Indexierung), so muss das Information Retrieval System die Inhalte in geeigneter Form zugänglich sowie auffindbar machen. Historisch bauten so genannte «intellektuelle Inhaltsanalysen» zumindest teilweise auf dem Lesen der zu indexierenden Dokumente durch Fachexpert/innen auf, das auch eine (zusätzliche) manuelle Beschlagwortung und Kategorisierung nach sich zog. Demgegenüber arbeiten automatische oder maschinelle Verfahren ausschließlich mit statistischen und/oder linguistischen Textanalysen.8 Bereits 20009 hält Stock fest: «Angesichts der Tatsache dass diverse Datenbanken so schnell wachsen, dass eine intellektuelle Auswertung allein aus Massengründen kaum noch möglich ist [...], wird die automatische Indexierung in der Informationswirtschaft zunehmend wichtig.» Eine automatische 1:1 Indexierung der Dokumenten-Volltexte hat zunächst den (argumentativen) Vorteil dass «nichts weggelassen und nichts hinzugetan» wird, sprich das von den Autor/innen Gesagte ganz genau abgespeichert wird. Fugmann10 arbeitet jedoch pointiert eine Schwierigkeit der Volltextindexierung im Zusammenspiel mit der Volltextsuche heraus: «Hier mangelt es an der Einsicht, dass es etwas Grundverschiedenes ist, ob man einen Text liest, oder aber ob er ohne Einblicknahme und ohne Kenntnis seines Wortlautes wiederaufgefunden werden soll. Die Texte sind für die Lektüre geschrieben. Sie sind für den Suchzweck wenig nützlich, wenn man nicht weiß, wie das Gesuchte in ihnen ausgedrückt sein könnte.»

3.

Trügerische Volltextsuche ^

[6]

Huditsch11 stellt aus ähnlichen Überlegungen fest dass zumindest die meisten der am deutschsprachigen Markt angebotenen Rechtsdatenbanken nach wie vor darauf vertrauen «das Informationsbedürfnis ihrer Kunden über eine mehr oder weniger einfach gehaltene Suche befriedigen zu können». Eine Volltextsuchmöglichkeit impliziert zwar die Möglichkeit im gesamten Text aller potentiellen Trefferdokumente suchen zu können, bedeutet aber genauso «zunächst die Abbildung des vom Anwender Gemeinten auf eine kleine Anzahl von Wörtern und das Auffinden der Zeichenketten dieser Wörter in anderen Zeichenketten: den Texten».12 Diesbezüglich bleiben Rechtsdatenbanken bisher in einem ganz zentralen Punkt zu sehr im traditionellen Verständnis einer Informationsrecherche durch so genannte «Information Professionals», also hauptberufliche Rechercheur/innen, stecken: Sie gehen davon aus dass die Nutzer/innen sowohl in der Lage sind als auch die Notwendigkeit erkennen eine Treffermenge auf eine für sie vollständig sichtbare Menge einzuschränken und das dann auch tatsächlich zu tun.

4.

Handlungsempfehlungen ^

[7]

Vor dem Hintergrund des genannten exponentiellen Anwachsens an Rechtsdatenbanken-Inhalten einerseits sowie dem Ersetzen von professionellen Rechercheur/innen durch so genannte Endnutzer/innen andererseits müssen Rechtsdatenbanken-Anbieter immer dringender die potentiellen Gefahren von Volltextsuchen abfedern. Schweighofer hat es bereits 199913 hervorragend beschrieben: «Dem wesentlich verbesserten Zugang zu den Rechtsmaterialien durch heutige Rechtsinformationssysteme steht eine ungenügende Reduktion der Materialfülle entgegen. Information Retrieval-Systeme sind daher heute vornehmlich elektronische Textsammlungen. Um den Anforderungen der Praxis zu genügen, müsste eine Aufbereitung der Materialien mit wesentlicher Reduktion der Informationsflut erfolgen. Als gute Beispiele können der Kommentar oder das System in der konventionellen Wissensrepräsentation genannt werden.» Richtigerweise hält auch Jahnel14 fest: «Aber natürlich will niemand alle Dokumente. Gefragt sind nicht hunderttausend Entscheidungen, sondern die für den gerade vorliegenden Fall passenden und entscheidenden.»

[8]

Alle Datenbankanbieter haben die beschriebenen Herausforderungen schon lange erkannt und arbeiten daran mehr zu bieten als reine Volltextsuchen. Im Zentrum steht hierbei die Entwicklung von zumindest fachgebietsspezifischen wenn nicht sogar User-spezifischen Relevanzsortierungen, was sich allerdings als äußerst komplex darstellt. Der Druck auf die Anbieter ist allerdings groß, Lewandowski15 erläutert: 

«Gleichzeitig zeigt insbesondere Google allerdings Folgendes auf: Mittels komplexer Rankingverfahren können selbst einfach gestaltete Suchanfragen zufriedenstellend beantwortet werden. Erreicht wird dies durch ein Eingehen auf die typischen Recherchekenntnisse sowie das typische Rechercheverhalten der Nutzer/innen und die Überlegung, einfach ‹das Beste daraus zu machen› ».

5.

Danksagung ^

[9]
Die inzwischen fast 10jährige Beschäftigung des Autors mit Rechtsdatenbanken wurde – neben Erich Schweighofer und Franz Kummer – auch ganz entscheidend vom Jubilar gefördert und geprägt. Friedrich Lachmayers Engagement für neue Ideen, seine wissenschaftliche Toleranz und sein Vertrauen in den Autor haben diesen über Jahre zutiefst beeindruckt und werden ihm immer ein Vorbild sein.

6.

Literatur ^

Fugmann, Robert, Theoretische Grundlagen der Indexierungspraxis, Indeks Verlag: Frankfurt am Main 1992

Huditsch, Roman, Taxonomien, Thesauri und Ontologien – Wegbereiter für bessere Online-Rechercheprodukte(?), in: Schweighofer / Geist / Staufer (Hrsg.), Globale Sicherheit und proaktiver Staat – die Rolle der Rechtsinformatik : Tagungsband des 13. Internationalen Rechtsinformatik-Symposions IRIS 2010; gewidmet Roland Traunmüller, Oesterreichische Computer Gesellschaft: Wien 2010, 273–276

Jahnel, Dietmar, Elektronische/konventionelle Suchmethoden – ein Gegensatz?, jur-pc: 1995, 3183–3191

Jahnel, Dietmar & Mader, Peter, Rechtsdatenbanken – Internet, Österreichische Verlags-Gesellschaft: Wien 2000

Kamphusmann, Thomas, Text-Mining: Grundlagen und Anwendungen, info7 17:3, 2002, 136–143

Lewandowski, Dirk, Der OPAC als Suchmaschine, in: Bergmann / Danowski, Handbuch Bibliothek 2.0, De Gruyter Saur: Berlin [u.a.] 2010, 87–107

Mielke, Bettina, Wider einige gängige Ansichten zur juristischen Informationserschließung, in: Hammwöhner / Wolff / Womser-Hacker, Information und Mobilität: Optimierung und Vermeidung von Mobilität durch Information; Proceedings des 8. Internationalen Symposiums für Informationswissenschaft (ISI 2002), UVK Verlagsgesellschaft: Konstanz 2002, 273–287

Nohr, Holger, Inhaltsanalyse, nfd – Information – Wissenschaft und Praxis, 50:2, 1999, 69–78

Nohr, Holger, Grundlagen der automatischen Indexierung, Logos-Verlag (3. Auflage): Berlin 2005

Schulz, Martin & Klugmann, Marcel, Wissensmanagement für Anwälte, Carl Heymanns: Köln [u.a.] 2005

Schweighofer, Erich, Rechtsinformatik und Wissensrepräsentation: automatische Textanalyse im Völkerrecht und Europarecht, Springer: Wien [u.a.] 1999

Schweighofer, Erich, Wissensrepräsentation in Information-Retrieval-Systemen am Beispiel des EU-Rechts, WUV-Univ.-Verlag: Wien 2000


 

Anton Geist, Produktmanager LexisNexis® Online, LexisNexis Verlag ARD Orac, Österreich.

  1. 1 (Mielke 2002, 274).
  2. 2 (Schulz / Klugmann 2005, 316).
  3. 3 (1999, 12).
  4. 4 (2000, 159).
  5. 5 (Jahnel / Mader 2000, 11).
  6. 6 (2010, 5).
  7. 7 (Nohr 2005, 20-21).
  8. 8 (Nohr 1999, 70).
  9. 9 (148).
  10. 10 (1992, 149).
  11. 11 (2010, 273).
  12. 12 (Kamphusmann 2002, 136).
  13. 13 (199).
  14. 14 (1995, 3185).
  15. 15 (2010, 88).