1.
Einführung ^
Die Analyse von Trends ist nicht neu, vielmehr gehört das Aufzeigen von Entwicklungstendenzen im Zeitverlauf zu den typischen Erkenntnisinteressen in vielen Disziplinen. Die konkrete Analyse auf der Basis digitaler Dokumentrepräsentation, d.h. umfangreicher Volltextkollektionen, dürfte aber eher noch Seltenheitswert besitzen. Für die Trendanalyse sind verschiedene Teildisziplinen von Bedeutung:
1. Angewandte Informatik, Corpuslinguistik, Sprachtechnologie
Voraussetzung für eine angemessene Verarbeitung großer Dokumentenmengen sind entsprechende Werkzeuge, die sowohl aus der Sprachtechnologie als auch aus der angewandten Informatik stammen können. Hier liegen mittlerweile viele und z.T. online verfügbare Werkzeuge vor. Das Spektrum solcher Werkzeuge reicht von Suchmaschinentechnologie, die große Volltextmengen durch Indexierung zugänglich machen kann, bis hin zu stärker auf corpuslinguistischen Fragestellungen ausgerichteten Anwendungen.
2. Informationswissenschaft, Bibliometrie bzw. Szientometrie
Vorliegend geht es um die Analyse der Entwicklung einer bestimmten Fachdisziplin – der Rechtsinformatik – in einer bestimmten Region (primär der zentraleuropäische Raum mit Schwerpunkt auf den deutschsprachigen Ländern). Die Untersuchung einer Wissenschaftsdisziplin im Zeitverlauf kann man dem Fächerspektrum der Bibliotheks- und Informationswissenschaft und konkret den fachlichen Schwerpunkten der Biblio- bzw. Szientometrie zurechnen. Biblio- und Szientometrie sind allerdings seit ihrer Einführung in den 1950er Jahren stark durch rein quantitative und standardisierte Auswertungsmechanismen geprägt gewesen, die (noch) nicht den Inhalt (Volltext) der untersuchten Literatur auswerten. Dazu gehören etwa die Berechnung von Zitationsindizes mit Hilfe von Datenbanken wie dem science citation index, die Anwendung von Metriken wie dem Hirsch-Index oder die Analyse von Autorennetzwerken, also Verfahren, die nicht die durch Text repräsentierten Inhalte analysieren.3 Eine fach- und inhaltsbezogene Auswertung gewinnt hingegen mit der Verfügbarkeit digitaler Volltexte und passender Werkzeuge an Bedeutung.
3. Rechtsinformatik
2.
Forschungsfragen ^
- Was sind die grundlegenden quantitativen Eckdaten des IRIS (Anzahl der Artikel, Seitenumfang etc.)?
- Welche Schwerpunkte lassen sich für die verschiedenen Jahre ausmachen?
- Welche Schwerpunkte sind im Zeitverlauf neu entstanden, schwächer geworden oder weggefallen?
- Schlagen sich die Themenschwerpunkte der verschiedenen Jahre erkennbar in den Beiträgen nieder?
- Haben sich die diskutierten Konzepte selbst verändert, m.a.W.: hat sich das semantische Umfeld von Schlüsselbegriffen der Rechtsinformatik im betrachteten Zeitraum verändert, und wenn ja, wie?
- Welche Akteure sind beteiligt und wie haben sich die Beziehungen zwischen den Akteuren verändert?
3.
Methodik ^
4.
Die IRIS-Tagungsbände 2000–2016 im Überblick ^
5.
Entwicklung der Themengruppen der IRIS-Bände 2000–2016 ^
6.
Inhaltliche Entwicklung – Vokabularanalyse ^
6.1.
Umfang des sprachlichen Materials (Tokens, Types) ^
Aus Tabelle 1 (folgende Seite) ergibt sich, dass die Zahl der Token (laufende Wortformen) stark zunimmt und sich von 2000 bis 2016 verfünffacht. Die Zahl der Types (unterschiedliche Wortformen) erhöht sich nicht im gleichen Maße, sondern verdreifacht sich lediglich, so dass die Type-Token-Relation deutlich sinkt. Der Umfang der Bände nimmt also schneller zu als ihre sprachliche Vielfalt. Dies bedeutet, dass man mehr Text lesen muss, um auf ein neues Wort zu stoßen, also letztlich mehr über dasselbe geschrieben wird.
6.2.
Häufigste und auffälligste Begriffe ^
Tabelle 2 und 3 machen deutlich, dass Recht als einziger Begriff in jedem Jahr unter den zehn häufigsten inhaltstragenden Begriffen ist. Bei den anderen Begriffen zeigt sich ein Wandel. So nehmen zuletzt englische Begriffe zu. Gleichzeitig geht die Häufigkeit der Begriffe zurück, die auf Österreich hindeuten. So ist der Ortsname Wien in den Jahren 2000, 2003, 2004, 2009 und letztmals 2011 unter den Top Ten.
Die Begriffe law, legal und data sind ab 2011 immer unter den Top Five der inhaltstragenden Begriffe. Wenn man über die jeweils zehn häufigsten Begriffe hinausgeht und die häufigsten 300 Begriffe auswertet, sieht man, dass der Begriff data bis 2007 nur zweimal unter den ersten 300 Begriffen auftaucht, nämlich 2003 auf Rang 26 und 2006 auf Rang 158. 2008 ist er dann auf Rang zwölf und 2010 auf Rang 26, während er 2009 nicht unter den ersten 300 Begriffen zu finden ist. In den ersten Jahren dominieren auch die Begriffe elektronisch und Internet, die dann seltener werden. Der Begriff elektronisch ist bis 2006 jeweils unter den Top Three, ab 2007 ist er nur noch vereinzelt unter den Top Ten (2008 auf Rang zehn, 2010 auf Rang neun und ab 2010 gar nicht mehr unter den Top Ten). Der zuletzt gesellschaftspolitisch stark diskutierte Begriff digital (digitale Agenden, Digitalisierung etc.) taucht 2015 erstmals in den Top Ten auf.
2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 | 2007 | 2008 |
information* | internet | internet | internet | elektronisch* | recht | elektronisch* | information* | government |
internet | elektronische | elektronisch* | elektronisch* | government | voting | information* | daten | information |
elektronische | government | daten | government | voting | elektronisch* | recht | government | recht |
wien | recht | government | recht | internet | online | government | voting | law |
recht | online | domain | daten | recht | bereich | internet | internet | daten |
computer | xml | verwaltung | wien | verwaltung | government | online | online | komplexität |
signaturen | information | tammelo | österreich | bereich | frage | daten | recht | eu |
demokratie | daten | recht | voting | information | daten | form | services | legal |
verwaltung | software | xml | verwaltung | wien | internet | web | online | |
ecash | commerce | commerce | schutz | daten | stellt | wissen | software | elektronische |
2009 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 |
rechtsinformatik | daten | daten | law | information | data | law | legal |
recht | law | legal | legal | daten | legal | legal | information |
legal | legal | data | data | data | information | data | data |
information | government | recht | internet | legal | law | information | law |
fiedler | recht | law | software | law | daten | daten | daten |
web | voting | government | recht | software | internet | digital | recht |
informatik | information | information | information | recht | open | recht | online |
law | online | internet | online | online | protection | internet | internet |
wien | elektronische | web | daten | form | recht | online | eu |
juristische | open | wien | business | government | transparenz | knowledge | security |
Tabelle 2: Die jeweils zehn häufigsten inhaltstragenden Begriffe des IRIS10
Seit einigen Jahren hat das IRIS regelmäßig ein prägnantes Konzept bzw. ein Generalthema als Tagungsmotto, anders als in den Anfangsjahren, als längere Titel üblich waren. In den Jahren 2013 bis 2016 waren dies die Themen Abstraktion und Applikation, Transparenz, Kooperation und Netzwerke mit den jeweiligen englischen Entsprechungen. Wir haben durch einen Vergleich der Häufigkeiten der Begriffe im Volltext des jeweiligen Jahres untersucht, wie stark das jeweilige Generalthema auch im Inhalt des Tagungsbandes aufscheint, wobei wir uns auf die deutschsprachigen Begriffe konzentrieren. Dazu haben wir die häufigsten 300 inhaltstragenden Wörter in den jeweiligen Tagungsbänden untersucht. Der Effekt ist deutlich: So tauchen die Begriffe Abstraktion und Applikation (Generalthema 2013) weder in den Vorjahren 2010 bis 2012 noch in den Folgejahren 2014 bis 2016 unter den häufigsten 300 sinntragenden Begriffen auf, belegen aber 2013 die Plätze 56 (Abstraktion) und 274 (Applikation). Das Generalthema Transparenz aus dem Jahr 2014, das in diesem Jahr unter den Top Ten der häufigsten Begriffe ist, kommt in den beiden Folgejahren nicht unter die 300 häufigsten Begriffe und belegt in den Vorjahren 2010 bis 2013 lediglich im Jahr 2011 Rang 278. Ähnlich ist es bei dem Begriff Kooperation, der Rang 15 im Jahr dieses Generalthemas belegt und sonst in den Jahren 2010 bis 2016 nicht unter den 300 häufigsten Begriffen ist. Auch der Begriff Netzwerke bzw. Netzwerke (Generalthema im Jahr 2016) kommt 2016 unter den 300 häufigsten Begriffen vor (Netzwerke auf Rang 204 und Netzwerk auf Rang 277), während die beiden Begriffe in den Vorjahren 2010 bis 2015 nicht unter den 300 häufigsten sinntragenden Begriffen waren. Die Autoren greifen das jeweilige Tagungsmotto also klar erkennbar auf.
In Tabelle 4 sind die jeweils zehn auffälligsten Begriffe (most disctinctive words) eines einzelnen Jahres im Verhältnis zum Gesamtcorpus aller IRIS-Bände aufgeführt. Die Jahre 2007 und 2008 fehlen, da aufgrund einer fehlerhaften Codierung und damit Fehlern im automatischen Datenexport die Daten für diese Auswertung nicht verwertbar sind. Anders als bei den häufigsten Begriffen, die eine Makroperspektive darstellen und eher die übergreifenden Themen herausarbeiten, zeigen diese Begriffe Besonderheiten der einzelnen Jahre auf: Beispielsweise war nur im Jahr 2000 von der agora die Rede, 2002 wurden webbugs thematisiert, ab 2011 taucht mehrfach netzneutralität als Thema auf und 2014 wurden bitcoins diskutiert.
2000 | ecash, agora, tammelo’s, iusmodell, münzen, spambots, zertifizierungsdiensteanbieter, sachverhaltsmodell, gegenakteur, schmutzer |
2001 | pte, vorabantrag, enderledigung, validator, informationsbegriff, watermarking, wasserzeichens, wasserzeichen, eugvü, raumzeitliche |
2002 | webbugs, webbug, schreiner, denic, nic.at, vergabestellen, starl, wbt, indexsuche, lerntext |
2003 | publikationsverzeichnis, öim, grundbuchs, argumentationsanalyse, cctld, webradio, rückruf, webradios, adoamt, unsend |
2004 | proeflokaal, kmdl, wien.at, bildung.at, stwt, auslandschweizer, parteiwechsel, tkv, raad, bildungspool |
2005 | enum, eumvvo, telfi, tabus, mahnverfahrens, gedankenexperimente, vsa, wwff, tabu, wissenslandkarte |
2006 | pitamic, jurex, vanity, reorganization, gpla, ersb, nummerninhaber, bsc, cecic, grundnorm |
2009 | smartvote, settlement, securities, trades, machinima, lexfind, vat, h.f, legiversum, xdomea |
2010 | ölrl, alrl, biometric, signatorin, strafwürdiger, productization, 2030, compliance, virtuallife, vorsitz |
2011 | dlp, ebi, netzneutralität, dyonipos, aphasie, scraping, gtelg, grids, metering, fcra |
2012 | noosphäre, facebook, zitiervorschlag, deceased, plagiarism, escrow, spyware, jusletter, pflegedokumentation, versorgungsleistungen |
2013 | usedsoft, aal, 9001, hörsaal, app, argumentationstheoriebasierte, psi, dpas, erschöpfungsgrundsatz, wahlbezirk |
2014 | pias, acta, bitcoins, osint, graduated, nichtrealistisches, zitiervorschlag, wdk, transparency, unbewegtes |
2015 | oss, cloud, parodie, qentis, fm, icj, contract, monkey, dpms, aktionärsforum |
2016 | iot, cyberlaw, bea, esma, cahve, hörsaal, policing, haapio, netzneutralität, kausalhaftung |
Tabelle 4: Auffälligste Begriffe in den jeweiligen IRIS-Bänden
7.
Fazit und Ausblick ^
8.
Danksagung ^
9.
Literatur ^
Ball, Rafael, Bibliometrie, Einfach – verständlich – nahvollziehbar, de Gruyter, Berlin/Boston 2014.
Cretchley, Julia/Rooney, David/Gallois, Cindy, Mapping a 40-Year History With Leximancer: Themes and Concepts in the Journal of Cross-Cultural Psychology, Journal of Cross-Cultural Psychology 2010, 41 (3), S. 318–328. DOI:10.1177/0022022110366105.
Garfield, Eugene, Citation Indexes for Science, A New Dimension in Documentation through Association of Ideas, Science 1955, 122, Nr. 3159, S. 108–111.
Mielke, Bettina/Wolff, Christian, Österreichisch-deutsche Rechtssprache kontrastiv. Eine corpuslinguistische Analyse. In: Schweighofer, Erich/Kummer, Franz/Hötzendorfer, Walter (Hrsg.), Abstraktion und Applikation, Tagungsband des 16. Internationalen Rechtsinformatik Symposions IRIS 2013, books@ocg.at, Wien 2013, S. 377–184.
Mielke, Bettina/Wolff, Christian, Justiz und Digitale Öffentlichkeit: Aufbau und Analyse eines Twittercorpus zum Thema Justiz. In: Schweighofer, Erich/Kummer, Franz/Hötzendorfer, Walter (Hrsg.), Kooperation, Tagungsband des 18. Internationalen Rechtsinformatik Symposions IRIS 2015, books@ocg.at, Wien 2015, S. 281–290.
Mielke, Bettina/Wolff, Christian, Österreichische und Deutsche Gerichtsentscheidungen im Sprachvergleich. In: Schweighofer, Erich/Kummer, Franz/Hötzendorfer, Walter/Borges, Georg (Hrsg.), Netzwerke, Tagungsband des 19. Internationalen Rechtsinformatik Symposions IRIS 2016, books@ocg.at, Wien 2016, S. 129–138.
Ravikumar, S./Agrahari, Ashutosh/Singh, S. N., Mapping the intellectual structure of scientometrics: a co-word analysis of the journal Scientometrics (2005–2010), Scientometrics 2015, 102 (1), S. 929–955. DOI:10.1007/s11192-014-1402-8.
Rooney, David/McKenna, Bernard/Barker, James R, History of Ideas in Management Communication Quarterly, Management Communication Quarterly 2011, 20 (10), S. 1–29. DOI:10.1177/0893318911405623.
Sidorova, Anna/Evangelopoulos, Nicholas/Valacich, Joseph S./Ramakrishnan, Thiagarajan (2008), Uncovering the intellectual core of the information systems discipline, MIS Quarterly 2008, 32 (3), S. 467–482.
Sinclair, Stéfan/Rockwell, Geoffrey/the Voyant Tools Team (2012), Voyant Tools (web application), 2012, https://voyant-tools.org/.
Sippl, Colin/Burghardt, Manuel/Mielke, Bettina/Wolff, Christian, Korpusbasierte Analyse österreichischer Parlamentsreden. In: Schweighofer, Erich/Kummer, Franz/Hötzendorfer, Walter/Borges, Georg (Hrsg.), Netzwerke, Tagungsband des 19. Internationalen Rechtsinformatik Symposions IRIS 2016, books@ocg.at, Wien 2016, S. 139–148.
- 1 Vgl. etwa Ball 2014.
- 2 Sidorova/Evangelopoulos/Valacich/Ramakrishnan 2008 und Rooney/McKenna/Barker 2011 (Wirtschaft), Cretchley/Rooney/Gallois 2010 (Psychologie) und Ravikumar/Agrahari/Singh 2015 (Szientometrie).
- 3 Garfield 1955; Ball 2014, S. 53, 77.
- 4 Mielke/Wolff 2013, 2015 und 2016.
- 5 Sinclair/Rockwell 2016.
- 6 Vgl. Mielke/Wolff 2013, S. 378.
- 7 https://voyant-tools.org/ (alle Websites geprüft am 26. Januar 2017).
- 8 http://jusletter-it.eu/.
- 9 Vgl. Mielke/Wolff 2016, S. 134.
- 10 * = Trunkierungsoperator für zusammengeführte Vollformen (elektronisch{e, en}).
- 11 Vgl. Sippl/Burghardt/Wolff/Mielke 2016 (Informationssystem zu österreichischen Parlamentsreden).