Generalisierung von formelhaften Textbestandteilen in juristischen Korpora: Einsatz- und Entwicklungspotential
Generalisierte Rechtsdokumente, bei denen für die individuellen Ausprägungen eines Vertrages die Positionen im Text bekannt sind, können eingesetzt werden, um erstens das Genehmigungsverfahren von Neuverträgen automatisiert zu unterstützen und zweitens als Vertragsgenerator neue Rechtsdokumente vorausgewählt zur Verfügung zu stellen. In diesem Beitrag wird, mithilfe von bekannten juristischen Texten gezeigt, wie formelhafte Textabschnitte identifiziert und häufige individuelle Ausprägungen klassifiziert werden können, um als Musterabschnitte eingesetzt zu werden. Es werden Einsatzbereiche vorgestellt und vorhandenes Potential für Legal Tech-Anwendungen aufgezeigt.
Inhaltsverzeichnis
- 1. Einleitung
- 2. Stand der Forschung und aktuelle Legal Tech-Anwendungen
- 3. Vorverarbeitung anhand Dokumentformat und juristischen Textphänomenen
- 3.1. Textextraktion aus gezeichneten PDF-Dokumenten
- 3.2. Textbereinigung
- 4. Generalisierung von formelhaften Textabschnitten
- 4.1. Verfahren für die Identifizierung von formelhaften Textabschnitten
- 4.2. Beispiele und Ergebnisse
- 4.2.1. Formelhafte Textabschnitte
- 4.2.1.1. Formelhafte Textabschnitte im Korpus „Urteile aus dem Strafrecht“
- 4.2.1.2. Formelhafte Textabschnitte im Korpus „Verträge aus Stadtverwaltungen und Hochschulen“
- 4.2.2. Musterhafte Variation und individuelle Ausprägung
- 4.2.2.1. Individuelle Ausprägungen von formelhaften Textabschnitten im Korpus „Urteile aus dem Strafrecht“
- 4.2.2.2. Individuelle Ausprägungen von formelhaften Textabschnitten im Korpus „Verträge aus Stadtverwaltungen und Hochschulen“
- 4.2.3. Erste Ergebnisse
- 5. Einsatzbereiche und Potential