Jusletter IT

Relevanzgewichtung von Verweisen

  • Author: Felix Gantner
  • Category of articles: AI & Law
  • Region: Germany
  • Field of law: AI & Law
  • Collection: Conference proceedings IRIS 2022
  • DOI: 10.38023/a3f3ee7d-ffd2-4875-9b37-c7e648a29613
  • Citation: Felix Gantner, Relevanzgewichtung von Verweisen, in: Jusletter IT 30 June 2022
Verweise sind typische Strukturelemente juristischer Dokumente. In Rechtsinformationssystemen werden sie nach Relevanz gefiltert als Metadaten Dokumenten zugeordnet und als Suchkriterien verwendet. Sollen semantische Modelle über Verweise und die sich dadurch ergebenden Zusammenhänge zwischen Rechtsdokumenten automatisiert erzeugt werden, dann ist eine Gewichtung der Verweise nach Relevanz notwendig. Einfache Gewichtungsalgorithmen wie eine undifferenzierte Summenbildung reichen dafür nicht aus. In diesem Artikel werden anhand von konkreten Daten einige Grundprobleme der Entwicklung von Algorithmen zur Relevanzgewichtung dargestellt.

Inhaltsverzeichnis

  • 1. Verweise in juristischen Texten
  • 2. Verweise als Metadaten in juristischen Informationssystemen
  • 3. Verweispositionen in Entscheidungsdokumenten
  • 4. Zählalgorithmen
  • 5. Begründungsabschnitte und Formulartexte
  • 6. Zusammenfassung
  • 7. Literatur

1.

Verweise in juristischen Texten ^

[1]

Verweise auf Rechtsvorschriften, Judikatur oder juristische Literatur sind typische Elemente juristischer Texte. Für die Rechtsinformatik waren sie daher seit langem von großem Interesse1. Schon in den ersten Rechtsinformationssystemen wurden sie auch als Suchkriterien oder zur automatisierten Erschließung der Semantik dieser Texte verwendet2.

[2]

Bei einer automatisierten Analyse von juristischen Texten stellt sich zusätzlich zum Problem des korrekten Erkennens und Auswerten eines juristischen Zitats die Frage nach dessen Bedeutung im Text. So hat ein Normzitat in einer Promulgationsklausel3 eine andere Funktion als ein Rechtsnormverweis im Text der Rechtsvorschrift.

[3]

Dies zeigt das Beispiel des Verordnungstextes der Herkunftsnachweispreis-Verordnung 2022 – HKN-V 20224. Trotz der Kürze dieses Normtextes haben die darin enthaltenen Rechtsvorschriftenzitate unterschiedliche Funktionen:

  • Promulgationsklausel: Auf Grund des § 10 Abs. 12 des Ökostromgesetzes 2012 (ÖSG 2012), BGBl. I Nr. 75/2011, zuletzt geändert durch das Bundesgesetz BGBl. I Nr. 150/2021, wird verordnet
  • Integration von Inhalten anderer Rechtsnormen: ... als Preis für die von der Ökostromabwicklungsstelle gemäß § 37 Abs. 1 Z 3 ÖSG 2012, BGBl. I Nr. 75/2011, zuzuweisenden Herkunftsnachweise ...
  • Änderung anderer Rechtsnormen: Die Herkunftsnachweispreis-Verordnung 2021 (HKN-V 2021), BGBl. II Nr. 547/2020, tritt mit Ablauf des 31. Dezember 2021 außer Kraft.
[4]

Diese Beispiele zeigen, dass eine einfache Text- und Zeichenanalyse, die unterschiedliche Bedeutungen gefundener Zitate nicht berücksichtigt, für eine semantische Erschließung juristischer Texte nicht ausreicht. Es ist notwendig, den Kontext, in dem das Zitat steht, zu berücksichtigen.

[5]

Im Folgenden werden einige Fragestellungen zur Problematik der Bewertung der Relevanz von Verweisen bei der automatisierten semantischen Erschließung juristischer Texte behandelt. Der Schwerpunkt liegt dabei auf Normzitaten in Rechtsprechungsdokumenten.

2.

Verweise als Metadaten in juristischen Informationssystemen ^

[6]

In Rechtsdatenbanken wie dem RIS werden Rechtsvorschriftenverweise als Metadaten Dokumenten zugeordnet und bei Recherchen gezielt abgefragt. Dabei werden in die Metadaten nur jene Rechtsnormen übernommen, die bei der Dokumentaufbereitung und -erfassung als relevant für die Beschreibung des Textinhalts angesehen werden. Auf Grund dieses Filtervorgangs enthalten die Metadaten häufig weniger Normverweise als die diesen Daten zugeordneten Dokumente selbst.

[7]

Zusätzlich ist zu beachten, dass die in den Metadaten enthaltenen Verweise meist nicht in Hinblick auf maschinelle Auswertungen, sondern für Menschen als Benutzer des Informationssystems formuliert werden. Das kann bei Recherchen oder automatisierten Auswertungen zu Unschärfen führen.

[8]

So werden in den RIS-Dokumenten des VfGH mehrere Rechtsnormzitate, die sich auf dieselbe Rechtsvorschrift beziehen, in einer Zeile, also einem Metadatensatz zusammengefasst. Da dadurch pro Metadatensatz mehr als eine Rechtsvorschrift enthalten sein kann, können die bei einer Volltextsuche durchgeführten Vergleiche auf Zeichenebene Übereinstimmungen in mehr als einem Rechtsnormverweis gleichzeitig finden. Abbildung 1 zeigt ein solches Metadatum, sowie ein Suchkriterium, das bei einer Normensuche uU zu unrichtigen Rechercheergebnissen führt.

Abbildung 1: Unschärfe bei Normsuche

[9]

Wegen derartiger Effekte und vor allem wegen der reduzierten Anzahl an Normverweisen durch die erwähnte Filterung bei der Metadatenerzeugung wird bei einer automatisierten semantischen Textanalyse und beim Aufbau juristischer Wissensstrukturen und -netzwerke im Allgemeinen direkt auf die in den Entscheidungstexten enthaltenen Verweise zurückgegriffen.

[10]

Verweise sind aber nicht nur für den Bereich der Rechtsinformation von Bedeutung. So war der PageRank-Algorithmus5 die Grundlage für die Bewertung der Relevanz von Dokumenten in der Suchmaschine Google6. Ein wesentliches Element dieses Algorithmus ist die Abhängigkeit der Relevanz eines Dokuments von der Summe der Hyperlinks (= Verweise), die das jeweilige Dokument referenzieren. Einfach gesagt kann die Grundidee dieses Algorithmus zusammengefasst werden als: Je mehr Hyperlinks auf ein Dokument verweisen, desto wichtiger ist es.

[11]

Zu beachten ist, dass dies eine sehr vereinfachende Beschreibung des PageRank-Algorithmus ist. Die tatsächlich bei Google implementierten Algorithmen sind wesentlich komplexer und kombinieren unterschiedliche Techniken der Datenanalyse. So wurde die Relevanz von Textteilen bereits von Anfang an unter Berücksichtigung von Dokumentstrukturen und -positionen oder Formatierungen7 bewertet.

[12]

Für juristische Informationssysteme wurden ähnliche Ansätze vorgeschlagen8. Zumindest ein Teil der Semantik juristischer Texte soll über die darin enthaltenen Verweise erschlossen werden. Ein juristisches Dokument wird als Teil eines Netzwerks9 juristischer Informationsknoten angesehen und die Verweise als Kanten in dem dadurch aufgebauten Graphen.

[13]

Analog zu einer einfachen Sicht auf den PageRank-Algorithmus sind dann jene Verweise, die häufiger in einem Dokument vorkommen, wichtiger als jene, die selten vorkommen. Zusätzlich sind jene Dokumente, auf die häufig verwiesen wird, von größerer Bedeutung als jene, die selten zitiert werden. Oder mit Beispielen formuliert: Rechtsnormen, die in einem Judikaturdokument oft zitiert werden, sind für den Inhalt der Entscheidung wichtiger als jene, die seltener zitiert werden. Und jene Entscheidungen, die häufig zitiert werden, sind von größerer Bedeutung als jene, die nur selten in anderen Entscheidungen zitiert werden.

[14]

Damit scheint ein einfacher Algorithmus zur Berechnung der Relevanz einzelner Verweise und auch der dadurch verknüpften Dokumente gefunden zu sein. Im Folgenden wird anhand von Daten aus dem RIS überprüft, ob die genannten Annahmen durch Daten gestützt werden und ob sie daher bei der Entwicklung juristischer Informationssysteme und bei der semantischen Analyse von Rechtsprechungstexten berücksichtigt werden sollten.

3.

Verweispositionen in Entscheidungsdokumenten ^

[15]

In einem ersten Schritt wurden RIS-Dokumente aus der Teildatenbank VwGH analysiert und untersucht, in welchen Dokumentbereichen Verweise zu finden sind. Als Dokumentbereiche wurden die vom RIS vorgegebenen Dokumentabschnitte Betreff, Spruch, Sachverhalt, Begründung verwendet. In Tabelle 1 sind Beispiele von gefundenen10 Verweisen aufgelistet.

[16]

Erkennbar ist, dass in Betreff und Spruch – wenn überhaupt – nur Rechtsnormen und Aktenzahlen, die die Verfahren in den Vorinstanzen referenzieren, zu finden sind.

[17]

Die Aktenzahlen der Vorinstanzen wären im RIS für datenbankübergreifende Verweise relevant, beim VwGH also für Verweise auf Dokumente der Rechtsprechungsdatenbanken der Verwaltungsgerichte.

[18]

Die im Spruch genannten Rechtsnormen sind für eine automatisierte Erschließung des Entscheidungsgegenstands von großer Bedeutung. An dieser Stelle ist aber nur das Ergebnis der juristischen Argumentation zu finden, nicht die Argumentation selbst. Soll diese analysiert werden, dann müssen der Sachverhalt und die Begründung untersucht werden.

Position Beispiele
Betreff Aktenzahl(en) Vorinstanz
Angelegenheit nach § 57a KFG 1967
Angelegenheit nach § 35 Abs. 1 SPG
Spruch Gemäß § 30 Abs. 2 VwGG ... nicht stattgegeben.
Sachverhalt Nach Art. 133 Abs. 4 B-VG ist gegen ein Erkenntnis ...
Nach § 34 Abs. 1 VwGG sind Revisionen ...
Ein Ausspruch gemäß § 25a VwGG ... unterblieb.
Der VfGH lehnte ... mit Beschluss ... E 3186/2020-5 ab und trat ... gemäß Art. 144 Abs. 3 B-VG ... ab. ...
VfSlg. 12.271/1990, 13.044/1992 ...
Übertretung § 19 Abs. 2 erster Satz Wr. Wettengesetz, LGBl. Nr. 26/2016 in der Fassung LGBl. Nr. 48/2016 ... gemäß § 24 Abs. 1 Z 12 Wr. Wettengesetz iVm § 9 Abs. 1 VStG eine Geldstrafe ... (Verweis auf VwGH 22.7.2019, Ra 2019/02/0107, 0108, VwGH 7.8.2019, Ra 2019/02/0091, u.a.)
Brunner, 50 Jahre Aufhebung des Adels in Österreich, JBl. 1969, 139 ff.
Begründung Der Verwaltungsgerichtshof hat in einem nach § 12 Abs. 1 Z. 2 VwGG/gemäß § 13 Abs. 1 Z 1 VwGG gebildeten Senat erwogen:
Nach Art. 133 Abs. 4 B-VG ist gegen ein Erkenntnis ... Nach § 34 Abs. 1 VwGG sind Revisionen ...des Art. 133 Abs. 4 B-VG ... § 19 Abs. 1 und 2 Wr. Wettengesetz in der (Stamm-)Fassung LGBl. Nr. 26/2016 lauten:
VwGH 22.7.2019, Ra 2019/02/0107-0108
(vgl. Pürstl/Zirnsack, SPG2 (2011), Anm. 26 zu § 35)
Voraussetzungen der Identitätsfeststellung nach § 35 Abs. 1 Z 6 SPG ... legte die Revision ... somit nicht dar
Das angefochtene Erkenntnis war daher gemäß § 42 Abs. 2 Z 1 VwGG wegen Rechtswidrigkeit seines Inhaltes aufzuheben. ... keine Rechtsfragen ... im Sinne des Art. 133 Abs. 4 B-VG grundsätzliche Bedeutung ...
... Aufwandersatz ... §§ 47 ff VwGG iVm VwGH-Aufwandersatzverordnung 2014

Tabelle 1: Beispiele für Verweise an unterschiedlichen Positionen im Entscheidungstext

[19]

Sowohl Sachverhalt als auch Begründung können alle Arten von Zitaten enthalten. In diesen Bereichen sind Rechtsnorm- und Judikaturverweise, aber auch Literaturzitate zu finden.

[20]

Beim Sachverhalt ist bei Entscheidungen im Instanzenzug zusätzlich zwischen einer Fallschilderung und den Feststellungen der Instanz zu unterscheiden.

[21]

Bei der Begründung ist zu beachten, dass diese selbst aus mehreren Abschnitten zusammengesetzt ist. Am Beginn steht oft ein Formulartext, der auch Rechtsnormverweise enthält: Der Verwaltungsgerichtshof hat in einem nach § 12 Abs. 1 Z. 2 VwGG/gemäß § 13 Abs. 1 Z 1 VwGG gebildeten Senat erwogen.

[22]

In den meisten Fällen ist so ein Formulartext und das darin enthaltene Normzitat für den Entscheidungsinhalt ohne Bedeutung und kann daher bei einer semantischen Analyse ignoriert werden. Ein Verweis auf § 13 Abs. 1 Z 1 VwGG (= verstärkter Senat) kann die Relevanz von Verweisen jedoch wesentlich erhöhen.

[23]

Ähnliches gilt für Formulartexte zu Kostenentscheidungen, die sehr häufig in vielen Entscheidungstexten mit fast identem Wortlaut (§§ 47 ff VwGG iVm VwGH-Aufwandersatzverordnung 2014) zu finden sind. Handelt es sich um einen Formulartext, dann ist die Relevanz dieses Zitats gering. Wird jedoch auf dieselbe Rechtsnorm in abweichenden Formulierungen verwiesen, dann kann diesem Verweis mit großer Wahrscheinlichkeit eine große Relevanz und hohe Bedeutung für die zu modellierende Semantik zugeordnet werden.

[24]

In der Begründung werden häufig am Beginn der Argumentation die in der Folge wesentlichen Rechtsvorschriften im Wortlaut angeführt und zitiert. Die Relevanz dieser Zitate ist sehr hoch und kann als Ausgangspunkt für die Bewertung der im weiteren Text folgenden Verweise dienen.

[25]

Zusätzlich ist zu beachten, dass die Begründung mehrere Abschnitte enthalten kann, die unterschiedlich lange sind und damit alleine schon wegen der Variation der Zeichenanzahl pro Abschnitt unterschiedlich viele Verweise enthalten. Ein einfaches Zählen von Zitaten reicht daher nicht aus. Es ist notwendig, das Zählergebnis auf den jeweiligen Argumentationsabschnitt zu beziehen. Die Relevanz eines Verweises wird damit über den Abschnitt, in dem er zu finden ist, definiert.

[26]

Dieser kurze Überblick zeigt bereits, dass alleine die Struktur von Judikaturtexten viele Anhaltspunkte geben, dass ein einfaches Zählen von Verweisen nicht ausreicht, um deren Relevanz zu beurteilen. Die Dokumentstruktur muss in Algorithmen zur Relevanzgewichtung von Verweisen einfließen.

4.

Zählalgorithmen ^

[27]

Doch zusätzlich zur Dokumentstruktur stellt sich bei der Entwicklung von Zählalgorithmen die Frage, wie gezählt werden soll und welche Daten berücksichtigt werden sollen.

[28]

Im Folgenden wird dies anhand der (häufigsten) Zitate, die in dem VwGH-Erkenntnis Ro 2017/06/002911 enthalten sind, dargestellt.

[29]

Zuerst am einfacheren Fall der Rechtsprechungszitate. Hier werden in Tabelle 2 die Summen unter Berücksichtigung der gerade oben beschriebenen Entscheidungsabschnitte gebildet. Dabei wird in dieser und auch der nächsten Tabelle beim Sachverhalt unterschieden zwischen der Beschreibung des Falls (SVf) und der Instanzenentscheidung (SVi). In der Begründung wird differenziert zwischen dem Bereich der wörtlichen Rechtsvorschriftenzitate (Brv) und der übrigen Begründung (B). S gibt die Gesamtsumme12 an.

[30]

Wenig überraschend sind die meisten Verweise auf Judikatur in B und SVi enthalten.

[31]

Auch wenn über eine Summenbildung erkennbar ist, dass das Zitat Ro 2015/06/0021 mit S = 4 für diese Entscheidung von besonderer Relevanz ist, kann ein einfaches Summieren ohne Berücksichtigung des Textabschnitts nicht als ausreichend angesehen werden.

[32]

In Tabelle 2 sind auch zwei Zitate, 2008/05/0073 und 2012/06/0103, zu finden, die nur in SVi zu finden sind. Der VwGH ist bezüglich dieser Verweise in seiner Argumentation nicht auf die Ausführungen der Vorinstanz eingegangen und hat damit ausgedrückt, dass diese Entscheidungen keine Relevanz haben.

[33]

Diese Einschätzung des VwGH bezüglich der Relevanz muss bei einer Relevanzgewichtung berücksichtigt werden. Es kann die zusätzliche Regel für die Auswertung aufgestellt werden, dass Zitate, die nur im Sachverhalt, aber nicht auch in der Begründung vorkommen, sehr geringe Relevanz zugeordnet bekommen.

[34]

Umgekehrt zeigt ein Vorkommen eines Zitates in mehreren unterschiedlichen Textabschnitten, dass eine hohe Relevanz zuzuordnen ist, da mehrere Rechtsprechungsinstanzen sich mit dem zitierten Judikat auseinandergesetzt haben.

 

GZ SVf SVi B Brv S
Ro 2015/06/0021 0 1 3 0 4
84/06/0031 0 0 1 0 1
90/06/0164 0 0 1 0 1
97/06/0247 0 0 1 0 1
2000/06/0193 0 0 1 0 1
2008/05/0073 0 1 0 0 1
2011/05/0020 0 0 1 0 1
2012/06/0103 0 1 0 0 1
2013/06/0243 0 0 1 0 1
Ra 2017/06/0117 0 0 1 0 1
Ra 2017/06/0122 0 0 1 0 1
Ra 2018/06/0241 0 0 1 0 1

Tabelle 2: Summen Rechtsvorschriftenverweise

[35]

Hier zeigen sich auch die Unterschiede zwischen Informationssystemen, die die semantische Relevanz von Textelementen abbilden sollen, und einfachen Volltextdatenbanken. Während bei Volltextsystemen, die ausschließlich Zeichenfolgen in Texten auswerten, alle drei genannten Verweise (Ro 2015/06/0021, 2008/05/0073 und 2012/06/0103) dieselbe Relevanz haben, führt eine semantische Relevanzbewertung unter Berücksichtigung der Dokumentstruktur zu anderen Ergebnissen. In diesem Fall wird dem ersten Verweis eine sehr hohe und den beiden anderen eine sehr geringe Relevanz zugeordnet.

[36]

Entscheidungszitate sind als sehr einfach zu analysierende und auszuwertende Verweise einzuordnen. Im Gegensatz dazu sind Rechtsnormzitate Teil einer hierarchischen Informationsstruktur, die auch bei der Relevanzbewertung berücksichtigt werden muss. Es ist bei diesen Verweisen nicht mehr eindeutig, was unter einer Summenbildung zu verstehen ist und wie diese durchgeführt werden soll.

[37]

Die am häufigsten in Ro 2017/06/0029 zitierte Rechtsvorschrift ist § 4 K-BV. Deren ebenfalls zitierte Untergliederungen lauten § 4 Abs. 1 letzter Satz K-BV und § 4 Abs. 2 K-BV.

[38]

Auch für diese Rechtsnormen gilt, dass in SVf keine Zitate zu finden sind. Dafür sind zusätzlich zu B auch in SVi und Brv Verweise enthalten. Im Anschluss an die obigen Ausführungen müsste bereits ein gemeinsames Vorkommen in SVi und B zu einer wesentlichen Erhöhung des berechneten Relevanzwertes führen. Zusätzlich bedeutet ein Normzitat in Brv einen Hinweis auf eine besondere Bedeutung für die nachfolgende Argumentation und eine weitere Erhöhung der Relevanz.

[39]

Neben diesen Gewichtungen muss bei der Entwicklung eines Algorithmus zur Berechnung von Relevanzen noch die hierarchische Informationsstruktur berücksichtigt werden. Dabei stellt sich die Frage, wie hierarchische Beziehungen in einer solchen Berechnung abgebildet werden.

[40]

Soll die Informationsstruktur in den Algorithmus einfließen, dann können die einzelnen Verweise, die Teil einer hierarchischen Struktur sind, nicht als voneinander unabhängig betrachtet werden. Für die Summenberechnung hat dies zur Konsequenz, dass die Werte der verknüpften Elemente auf die Relevanzwerte Einfluss haben.

[41]

Welche Änderungen eine solche Vorgehensweise hat, zeigt Tabelle 3. Dabei werden die zwei einfachsten Algorithmen zur hierarchischen Summenbildung, nämlich das Mitzählen untergeordneter bzw. übergeordneter Elemente dargestellt. Bei einem tatsächlich in einem juristischen Informationssystem verwendeten Algorithmus würde wahrscheinlich mit Gewichtungsfaktoren, die von der Hierarchieebene abhängen, gerechnet werden.

RV SVf SVi B Brv S
§ 4 K-BV 0 4 3 1 8
§ 4 Abs. 1 letzter Satz K-BV 0 5 5 1 11
§ 4 Abs. 2 K-BV 0 6 4 1 11
übergeordnete Mitzählen          
§ 4 K-BV 0 4 3 1 8
§ 4 Abs. 1 K-BV 0 4 3 1 8
§ 4 Abs. 1 letzter Satz K-BV 0 9 8 2 19
§ 4 Abs. 2 K-BV 0 10 7 2 19
untergeordnete Mitzählen          
§ 4 K-BV 0 15 12 3 30
§ 4 Abs. 1 K-BV 0 5 5 1 11
§ 4 Abs. 1 letzter Satz K-BV 0 5 5 1 11
§ 4 Abs. 2 K-BV 0 6 4 1 11

Tabelle 3: Ergebnisse unterschiedlicher Zählalgorithmen

[42]

Entscheidet man sich bei der Definition des Summenalgorithmus für ein Mitzählen übergeordneter Werte, dann bildet das die Idee ab, dass eine Untergliederung immer auch mit dem Verweis auf die übergeordnete Struktur mitgemeint ist. Ein Zitat der Untergliederung wird aber zusätzlich als Verweis auf die speziellere Rechtsnorm und daher relevanter angesehen. Bei den Untergliederungen sind daher die Summenwerte übergeordneter Elemente hinzuzufügen.

[43]

Genau umgekehrt wird beim Mitzählen untergeordneter Elemente vorgegangen. Hier werden die Werte bei den übergeordneten Elementen hinzugefügt. Diese Vorgangsweise liegt bei Informationssystemen nahe, bei denen Dokumente in größeren Einheiten abgespeichert werden. Sie können daher nicht anders als auf oberen Hierarchieebenen angesprochen werden, was sich auch in den Berechnungsmethoden niederschlägt.

[44]

In Tabelle 3 ist erkennbar, dass die Summenwerte sehr stark mit dem gewählten Algorithmus für die Summenbildung variieren. Die konkrete Gestaltung eines Auswertungsalgorithmus beeinflusst das Ergebnis der Berechnungen und damit auch die Abbildung der Semantik der Entscheidungsinhalte.

[45]

Fehlen in der Informationshierarchie einzelne Elemente, dann kann es notwendig sein, dass diese im Rahmen der Berechnung erzeugt werden müssen. Bei § 4 Abs. 1 K-BV handelt es sich um ein derartiges berechnetes Verweiselement, das im Entscheidungstext nicht vorkommt. Ihm müssen für die Ausführung des Summenalgorithmus Relevanzwerte zugeordnet werden.

[46]

Algorithmen werden in Hinblick auf Nützlichkeit und technische Umsetzbarkeit entwickelt. Kann keine Entscheidung zwischen Überordnung und Unterordnung getroffen werden, dann ist es auch möglich, jedem Element der Hierarchie denselben Relevanzwert zuzuordnen. In diesem Fall geht aber – zumindest teilweise – die Information über die hierarchischen Zusammenhänge verloren.

5.

Begründungsabschnitte und Formulartexte ^

[47]

Oben wurde auch darauf hingewiesen, dass auch unterschiedliche Abschnitte in der Begründung und Formulartexte bei der Berechnung von Relevanzgewichtungen berücksichtigt werden müssen. Im vorherigen Abschnitt wurde dies nicht getan, um einige prinzipiellen Probleme, die bei der Definition eines Summenalgorithmus im Zusammenhang mit Zitaten zu lösen sind, darzustellen. Sämtliche berechneten Werte betrafen das ganze Dokument bzw. die ganze Begründung.

[48]

In der Begründung von Ro 2017/06/0029 sind mehrere Abschnitte enthalten. Das Ende des ersten Abschnittes und der Beginn des zweiten lauten:

Der angefochtene Beschluss war daher gemäß § 42 Abs. 2 Z 1 VwGG wegen prävalierender Rechtswidrigkeit seines Inhaltes aufzuheben.
Die Kostenentscheidung beruht auf den §§ 47 ff VwGG in Verbindung mit der VwGH-Aufwandersatzverordnung 2014.
Gemäß § 47 Abs. 4 VwGG hat die (obsiegende) Revisionswerberin (unter anderem) in dem hier vorliegenden Fall einer Amtsrevision gemäß Art. 133 Abs. 6 Z 2 und Abs. 9 B- VG keinen Anspruch auf Aufwandersatz, weshalb der diesbezügliche Antrag abzuweisen war (vgl. VwGH 17.12.2020, Ra 2018/06/0241, mwN).
[49]

Deutlich erkennbar ist im ersten zitierten Absatz an der formelähnlichen Ausdrucksweise, dass eine Argumentation beendet wurde. Ein tatsächlich in vielen Entscheidungen des VwGH oft zeichenident zu findender Formeltext ist der erste Satz des zweiten Absatzes. Der Text wurde kursiv gesetzt.

[50]

Die Rechtsvorschriftenzitate in beiden formelhaften Texten haben keine bzw. kaum Relevanz für die Semantik der Entscheidungsbegründung. Ein Algorithmus zur Berechnung einer Relevanzgewichtung müsste dies erkennen und die Zitate entsprechend bewerten.

[51]

Gleichzeitig enthält der zweite Satz dieses Absatzes mehrere Verweise, denen eine hohe Relevanz zuzuordnen ist. Da es sich um einen Begründungsabschnitt mit wenig Text handelt, hat auch ein Zitat, das nur ein einziges Mal vorkommt, hohe Relevanz.

6.

Zusammenfassung ^

[52]

Bei der Modellierung juristischer Semantik und der damit verbundenen Analyse der Verweisstrukturen in Entscheidungsdokumenten stellt sich die Frage einer Relevanzgewichtung der Verweise.

[53]

Bereits die hier kurz dargestellten Problembereiche der Komplexität juristischer Dokumente und der konkreten Gestaltung der Berechnungsalgorithmen zeigen, dass eine semantische Analyse von Verweisstrukturen und die Bewertung der Relevanz einzelner Zitate nicht durch einfache Summenbildung bewerkstelligt werden kann. Eine Übertragung vereinfachter Versionen des PageRank-Algorithmus führt nicht zu den gewünschten Ergebnissen.

7.

Literatur ^

Berger, Albrecht, Die Erschließung von Verweisungen bei der Gesetzesdokumentation, Verlag Dokumentation, München-Pullach Berlin 1971.

Brin, Sergey/Page, Lawrence, The anatomy of a large-scale hypertextual Web search engine, Computer Networks and ISDN Systems, 30 (1–7), S. 107–117, http://infolab.stanford.edu/pub/papers/google.pdf (aufgerufen am 13. November 2021).

Manning, Christopher D./Raghavan, Prabhakar/Schütze, Hinrich, Introduction to Information Retrieval, Cambridge University Press, Cambridge 2008.

Page, Lawrence/Brin, Sergey/Motwani, Rajeev/Winograd, Terry, The PageRank citation ranking: Bringing order to the Web, 1999, http://ilpubs.stanford.edu:8090/422/1/1999-66.pdf (aufgerufen am 13. November 2021).

Smith, Thomas A., The Web of Law, San Diego Law Review, 2007, Vol 44, S. 309–354.

Staats, Johann-Friedrich, Verweisungen und Grundgesetz. In: Rödig, Jürgen (Hrsg.), Studien zu einer Theorie der Gesetzgebung, Springer Verlag, Berlin – Heidelberg 1976, S. 244–260.

Svoboda, Werner Robert, Theorie und Praxis der juristischen Automation. In: Lang, Friedrich/Bock, Friedrich (Hrsg.), Wiener Beiträge zur elektronischen Erschließung der Information im Recht, IBM Österreich, Wien 1973, S. 31–41.

Tapper, Colin, The Use of Citation Vectors for Legal Information Retrieval, Journal of Law & Information Science, 1982, Heft 2, S. 131–161.

  1. 1 Grundlegend Berger, Albrecht, Die Erschließung von Verweisungen bei der Gesetzesdokumentation.
  2. 2 Vgl. z.B. Svoboda, Werner Robert, Theorie und Praxis der juristischen Automation, 37: „In rechtswissenschaftlichen Abhandlungen vorkommende Zitate sind mittels eines speziellen Dokumentationsverfahrens für die Suche nach relevanten Dokumenten nutzbringend anwendbar. ..., denn das Auffinden relevanter Dokumente geschieht über die sich aus den Zitaten ergebenden Zusammenhänge ...“
  3. 3 Staats, Johann-Friedrich, Verweisungen und Grundgesetz, 246f: „Änderungsgesetze zitieren naturgemäß das zu ändernde Gesetz, Verordnungen die Ermächtigungsgrundlage . . . , Ausführungsgesetze der Länder das auszuführende Gesetz des Bundes. In diesen Fällen hat die Bezugnahme nicht die für Verweisungen typische Funktion, die ich Übertragungsfunktion nennen möchte: Der gedankliche Inhalt des in Bezug genommenen Inhalts wird nicht Inhalt der zitierenden Norm. Es ist eine rein formale Bezugnahme . . .“
  4. 4 Verordnung des Vorstands der E-Control über den Preis von durch die Ökostromabwicklungsstelle zuzuweisenden Herkunftsnachweisen 2022 (Herkunftsnachweispreis-Verordnung 2022 – HKN-V 2022), BGBl. II Nr. 530/2021, https://www.ris.bka.gv.at/eli/bgbl/II/2021/530/20211209.
  5. 5 Manning, Christopher D./Raghavan, Prabhakar/Schütze, Hinrich, Introduction to Information Retrieval, 424ff.
  6. 6 Page, Lawrence/Brin, Sergey/Motwani, Rajeev/Winograd, Terry, The PageRank citation ranking: Bringing order to the Web.
  7. 7 Brin, Sergey/Page, Lawrence, The anatomy of a large-scale hypertextual Web search engine, 7: “The hits record the word, position in document, an approximation of font size, and capitalization.”
  8. 8 Tapper, Colin, The Use of Citation Vectors for Legal Information Retrieval.
  9. 9 Smith, Thomas A., The Web of Law.
  10. 10 Es wird hier auf die Angabe der einzelnen RIS-Dokumente, in denen die Texte gefunden wurden, verzichtet, da diese Information für den Inhalt dieses Artikels wenig Bedeutung hat. Über eine Phrasensuche können die Dokumente im RIS leicht gefunden werden.
  11. 11 ECLI:AT:VWGH:2021:RO2017060029.J00.
  12. 12 S = SVf + SVi + Brv + B.