Dieser Beitrag aus dem Tagungsband des Internationalen Rechtsinformatik Symposiums 2006 steht Ihnen hier zum Download zur Verfügung.
Computerlinguistische Methoden für die Rechtsterminologie
Dieser Beitrag stellt das Projekt CORTE (Computerlinguistische Methoden für die Rechtsterminologie) vor, das sich mit der Entwicklung computerlinguistischer Verfahren zur automatischen Extraktion und Verarbeitung von Definitionen in deutschen Gerichtsentscheidungen beschäftigt.
Mittels eines robusten, semantisch orientierten Parsingsystems werden linguistische Strukturen für den Text von Urteilsbegründungen ermittelt, in einem XML-Format abgelegt und dann nach sprachlichen Mustern durchsucht, die charakteristisch für Definitionen sind. Die Fundstellen werden
dann automatisch in die strukturellen Bestandteile einer Definition (Definiendum, Definiens usw) zergliedert. Durch die Ergebnisse kann beispielsweise eine gezielte Informationssuche auf begrifflicher Basis und das textbasierte Update juristischer Ontologien unterstützt werden.
Mittels eines robusten, semantisch orientierten Parsingsystems werden linguistische Strukturen für den Text von Urteilsbegründungen ermittelt, in einem XML-Format abgelegt und dann nach sprachlichen Mustern durchsucht, die charakteristisch für Definitionen sind. Die Fundstellen werden
dann automatisch in die strukturellen Bestandteile einer Definition (Definiendum, Definiens usw) zergliedert. Durch die Ergebnisse kann beispielsweise eine gezielte Informationssuche auf begrifflicher Basis und das textbasierte Update juristischer Ontologien unterstützt werden.