1.
Einleitung ^
Mit der steigenden Interoperabilität von IT-Systemen und -Plattformen sowie der damit verbundenen Portabilität von Daten rücken neben Content auch technische Artefakte wie Daten und korrespondierende Services in den Fokus des kommerziellen Interesses. Dies zeigt sich einerseits in der wachsenden Bedeutung von Daten in der digitalen Wertschöpfung – speziell im Kontext der stark auf Datenanalytik, Automatismen und Co-Produktion basierenden service-orientierten Logik des eCommerce –, andererseits in der fortwährenden Entwicklung neuer Standards und Methoden zur Bewirtschaftung von Daten unter netzökonomischen Bedingungen [Shy 2001, S. 10]. Beispiele dafür sind etwa die Semantic Web Initiative des World Wide Web Konsortiums1, das Projekt «WikiData» der Wikimedia Foundation2 oder die Metadateninitiative «schema.org»3 der Suchmaschinenbetreiber Google, Bing und Yahoo. Begriffe wie «Big Data» als konzeptioneller Überbau und «Linked Data XE» als technologisch-methodische Basis sind Ausdruck einer zunehmenden Professionalisierung der Datenbewirtschaftung und damit einhergehender Kommerzialisierung. Befeuert wird diese Entwicklungen durch die partielle bis totale Offenlegung von Daten im Zuge von Open Access bzw. Open Government Initiativen oder Open Innovation Strategien, sowie den zunehmenden Einsatz von Dual Licensing Strategien als Bestandteil einer geschäftsimmanenten Logik in der Bewirtschaftung vernetzter Daten.
- Anbahnungskosten: Recherche und Vorauswahl der geeigneten Datenquellen
- Informationsbeschaffungskosten: Recherche ausreichender Lizenzinformation für den konkreten Anwendungsfall
- Vereinbarungskosten: Prüfen von Lizenzkonflikten und ggfs. Aushandlung individueller Nutzungsbedingungen
2.
Datenlizenzierung und Lizenzierungspraxis – Forschungsstand ^
Generell liegt diesen Ausführungen eine schlechte empirische Datenlage zugrunde, insbesondere im Kontext cloud-basierter Lizenzierungspraxis. Eine Erhebung der Ontology Engineering Group der Universität Madrid im Jahr 2013 zur Verfügbarkeit von Lizenzinformationen in der sog. «Linked Open Data Cloud» ergab, dass etwa 40% aller Datensätze keine Angaben zu den Nutzungsbedingungen enthielten bzw. in etwa 30% der Fälle die verfügbare Lizenzinformation nicht das volle Schutzspektrum vor allem im Zusammenspiel aus Urheber- und Datenbankrecht bediente.7 Zu vergleichbaren Befunden kommen auch Jain et al. [2013]. In einer aktuelleren Untersuchung der Linked Open Data Cloud durch Jentzsch [2014] wurden neben dem thematischen Spektrum der verfügbaren Daten sowohl deren technische Güte als auch die verfügbaren Lizenzinformationen in maschinen-verarbeitbarer Form untersucht. Laut ihren Ergebnissen weisen gar nur 2,7% der verfügbaren Datensätze eine maschinenlesbare Referenz zu Lizenzinformationen aus. Eine cloud-vergleichende Analyse zur Lizenzierungspraxis ist Bestandteil der folgenden Ausführungen.
3.1.
Fragestellungen und Methode ^
- Sind die Datensätze mit Lizenzinformation ausgestattet?
- Welche Lizenzen kommen zum Einsatz?
- Existieren Kompatibilitätskonflikte innerhalb und zwischen den Daten-Clouds?
- Wie hoch ist der Anteil maschinen-verarbeitbarer Lizenzinformation?
Datagov | OpenCanada | PublicData | Datahub | ||
1 | Datensätze | 132.206 | 244.257 | 55.481 | 9.371 |
2 | Lizenztypen | 10 | 3 | 50 | 33 |
3 | Creative Commons | 0,4% | 0,0% | 35,3% | 17,1% |
4 | Open Data Commons | 0,0% | 0,0% | 0,5% | 4,8% |
5 | Individuelle Lizenz | 0,0% | 100% | 39,9% | 19,0% |
6 | Keine Lizenz | 99,6% | 0,0% | 24,3% | 59,1% |
7 | Deref. Link | 0,4% | 100% | 43,2% | 23,1% |
8 | Mach. Read. | 0,0% | 0,0% | 2,6% | 2,2% |
3.2.
Befund 1: Unzureichende Informationslage ^
Die Befunde für datahub.io und publicdata.eu können sich unterschiedlich erklären lassen. Zum einen können die nötigen Lizenzinformationen schlichtweg fehlen, weil der Datenanbieter keine Erfahrung mit bzw. keine Kenntnis von der Lizenzierungspraxis hat oder aber die nötige Information nicht adäquat im Datensatz hinterlegt hat. So zeigt sich, dass die nötigen Lizenzinformationen an unterschiedlichsten Stellen und in unterschiedlichsten Formaten – von einem Statement auf der Webseite, über einen eingebetteten XML-Kommentar, bis zu alleinstehenden .txt-Files – verfügbar gemacht werden. Zum anderen können abweichende nationale Regelungen unterschiedliche Lizenzierungskonventionen bedingen. Während nämlich in den USA Datensätze ohne ausgewiesene Lizenzinformation generell als gemeinfrei gelten, bedarf es in der Europäischen Union der expliziten Lizenzierung für die Public Domain, ein Umstand, der im Falle schlecht verfügbarer Lizenzinformation zu erheblichen Folgeproblemen führen kann.
3.3.
Befund 2: Heterogene Rechtelage ^
3.4.
Befund 3: Kompatibilitätskonflikte ^
3.5.
Befund 4: Maschinelle Erschließung von Lizenzinformation ^
Zur maschinellen Auszeichnung von Licensing Policies wurden seit den 1990er Jahren sogenannte Rights Expression Languages (RELs) entwickelt, die dem Bereich der Digital Rights Management Technologien zuzurechnen sind [Prenafeta 2011]. RELs unterstützen die Identifikation, Filterung, Syndizierung und Modifikation von Content, der sich aus mehreren Quellen unterschiedlicher Rechteinhaber speist, und sie bilden die Grundlage für eine differenzierte automatische Prozessierung von Content z.B. im Rahmen von eContracting- und eProcurement-Maßnahmen. RELs, wie etwa die Open Defintions Rights Language (ODRL)17 oder die Creative Commons Rights Expression Language (CCREL)18 sind damit eine zentrale technologische Komponente in service-orientierten, hoch automatisierten, vernetzten Verwertungsstrukturen.
4.
Conclusio und Ausblick ^
5.
Literatur ^
Archer, Phil; Dekkers, Max; Goedertier, Stijn; Loutas, Nikolaos, Study on business models for Linked Open Government Data (BM4LOGD – SC6DI06692). Prepared for the ISA programme by PwC EU Services, 2013; Siehe http://ec.europa.eu/isa/documents/study-on-business-models-open-government_en.pdf (aufgerufen am 16. August 2015).
Backhaus, Martin, IT-gestütztes Rechte- und Lizenzmanagement im Rundfunk. Berlin: Logos, 2008.
Frosterus, Mattias; Hyvonen, Eero; Laitio, Joonas, Creating and publishing semantic metadata about linked and open datasets. In; Wood, David (Ed.). Linking Government Data. New York: Springer, 2011, S. 95–112.
Garcia, Roberto; Gil, Rosa, Copyright licenses reasoning using an owl-dl ontology. In: Law, Ontologies and the Semantic Web: Channelling the Legal Information Flood. Amsterdam: IOS Press, 2009, S. 145–162.
Groves, Peter, Sourcebook on Intellectual Property Law. London: Cavendish Publishing, 1997.
Guibault, Lucie; Angelopoulos, Christina, Open Content Licensing: From Theory to Practice. Amsterdam: University Press, 2011.
Hoffmann, A., Schulz, T., Zirfas, J., Hoffmann, H., Roßnagel, A., & Leimeister, J. M., Legal Compatibility as a Characteristic of Sociotechnical Systems: Goals and Standardized Requirements. Business & Information Systems Engineering, 57(2), 103–113. http://doi.org/10.1007/s12599-015-0373-5, 2015.
Hyland, Bernadette; Wood, David, The joy of data – a cookbook for publishing linked government data on the web. In: Wood, david (Ed.). Linking government data. New York: Springer, 2011, S. 3–26.
Hyvonen, Eero, Publishing and Using Cultural Heritage Linked Data on the Semantic Web. Synthesis Lectures on the Semantic Web. Morgan & Claypool Publishers, 2012.
Jain, Prateek; Hitzler, Pascal; Janowicz, Krzysztof; Venkatramani, Chitra, There’s No Money in Linked Data, 2013. In: http://knoesis.wright.edu/faculty/pascal/pub/nomoneylod.pdf (aufgerufen am 18. Dezember 2013)
Jentzsch, Anja, Linked Open Data Cloud. In: Pellegrini, Tassilo; Sack, Harald; Auer, Sören (2014). Linked Enterprise Data. Berlin: Springer Verlag, 2014, S. 209–220.
Mazziotti, Giuseppe, EU Digital Copyright Law and the End-User. Heidelberg: Springer, 2008.
Pellegrini, Tassilo, Semantic Metadata in the News Production Process. Achievements and Challenges. In: Lugmayr, Artur et al. (Eds). Proceed-ing of the 16th International Academic MindTrek Conference 2012. ACM SIGMM, 2012. S. 125–133.
Pellegrini, Tassilo, Linked Data Licensing – Datenlizenzierung unter netzökonomischen Bedingungen. In: Schweighofer, Erich; Kummer, Franz; Hötzendorfer, Walter (Hrsg.). Transparenz. Tagungsband des 17. Internationalen Rechtsinformatik Symposium IRIS 2014. Wien: Verlag der Österreichischen Computergesellschaft, 2014, S. 159–168.
Prenafeta, Javier, Protecting Copyright Through Semantic Technology. In: Publishing Research Quarterly, 26/4, 2010, S. 249–254.
Pucella, R.; Weissman, V., A logic for reasoning about digital rights. In: Proceedings of the 15th IEEE Computer Security Foundations Workshop, IEEE, 2002, S. 282–294.
Rotolo,Antonino; Villata, Serena; Gandon, Fabien, A deontic logic semantics for licenses composition in the web of data. In: Proceedings of the 14th International Conference on Artificial Intelligence and Law, ACM, 2013, S. 111–120.
Schaal, Ulrich, Das strategische Management von Contentrechten. Schlüsselherausforderungen für audiovisuelle Medienunternehmen. Wiesbaden: VS Verlag, 2010.
Shy, Oz, The Economics of Network Industries. Cambridge: Cambridge University Press, 2001.
Sonntag, Michael, Rechtsschutz für Ontologien. In: Schweighofer, Erich; Liebwald, Doris; Drachsler, Matthias; Geist, Anton (Eds.). e-Staat und e-Wirtschaft aus rechtlicher Sicht. Stuttgart: Richard Boorberg Verlag, 2006, S. 418–425.
Stallman, Richard; Lessig, Lawrence; Gay, Joshua, Free Software, Free Society: Selected Essays of Richard M. Stallman. Free Software Foundation, 2006.
Välimäki, Mikko, The Rise of Open Source Licensing: A Challenge to the Use of Intellectual Property in the Software Industry. Helsinki: Turre Publishing, 2005.
Villata, Serena; Gandon, Fabien, Licenses compatibility and composition in the web of data. CEUR Workshop Proceedings, 2012. Siehe auch: http://ceur-ws.org/Vol-914/paper_23.pdf (aufgerufen 15. August 2015).
- 1 Für einen Überblick über Semantic Web Standards siehe http://www.w3.org/standards/semanticweb/ (aufgerufen am 16. August 2015).
- 2 Siehe https://www.wikidata.org/wiki/Wikidata:Main_Page (aufgerufen am 16. August 2015).
- 3 Siehe https://schema.org/ (aufgerufen am 16. August 2015).
- 4 Exemplarisch genannt seien etwa Creative Commons, Open Data Commons und das gesamte Lizenzspektrum unter dem Label Free- und Open Source Software. Einen Überblick über verfügbare Open Source und Open Commons Lizenzen findet sich bei https://tldrlegal.com/ (aufgerufen am 16. August 2015).
- 5 Siehe https://data.un.org/Glossary.aspx?q=data (aufgerufen am 16. August 2015).
- 6 Siehe http://www.wipo.int/tk/en/resources/glossary.html#2 (aufgerufen am 16. August 2015).
- 7 Siehe auch http://oeg-dev.dia.fi.upm.es/licensius/static/observatory/#/step-1 (aufgerufen am 16. August 2015).
- 8 Siehe http://www.data.gov/ (aufgerufen am 16. August 2015).
- 9 Siehe http://open.canada.ca/en (aufgerufen am 16. August 2015).
- 10 Siehe http://www.publicdata.eu/ (aufgerufen am 16. August 2015).
- 11 Siehe https://okfn.org/ (aufgerufen am 16. August 2015).
- 12 Der Crawler wurde als GitHub-Projekt veröffentlicht unter https://github.com/AKSW/ckan-aggregator-py (aufgerufen am 16. August 2015).
- 13 Siehe http://www.data.gov/data-policy (aufgerufen am 16. August 2015).
- 14 Siehe http://www.tbs-sct.gc.ca/pol/doc-eng.aspx?id=28108 (aufgerufen am 16. August 2015).
- 15 Siehe http://opendefinition.org/ (aufgerufen am 16. August 2015).
- 16 Der Ausdruck «non-derivative» erlaubt keine Veränderung des Datensatzes. Der Ausdruck «non-commercial» verbietet die Verwendung des Datensatzes für kommerzielle Zwecke. Darunter versteht Creative Commons: «A commercial use is one primarily intended for commercial advantage or monetary compensation.» Siehe auch http://wiki.creativecommons.org/Frequently_Asked_Questions#Does_my_use_violate_the_NonCommercial_clause_of_the_licenses.3F (aufgerufen am 16. August 2015).
- 17 Siehe http://www.w3.org/community/odrl/ (aufgerufen am 2. Januar 2015).
- 18 Siehe http://www.w3.org/Submission/ccREL/ (aufgerufen am 2. Januar 2015).