Jusletter IT

Immaterialgüterrechtlicher Schutz von neuronalen Netzen (machine learning)

  • Author: Simon Schlauri
  • Category of articles: TechLawNews by Ronzani Schlauri Attorneys
  • Region: Switzerland
  • Field of law: Artificial Intelligence & Law, Personal Right, IP Law
  • Citation: Simon Schlauri, Immaterialgüterrechtlicher Schutz von neuronalen Netzen (machine learning), in: Jusletter IT 23 May 2019

Inhaltsverzeichnis

  • 1. Was ist machine learning?
  • 1.1. Begriffliches
  • 1.2. Trainieren statt programmieren
  • 1.3. Neuronale Netze
  • 1.4. Stand der Technik
  • 2. Rechtliche Aspekte von machine learning
  • 2.1. Urheberrecht
  • 2.2. Datenbankrecht
  • 2.3. Schlussbemerkung
[1]

Wird man als Jurist auf künstliche Intelligenz angesprochen, hört man öfters die Frage, wie es denn um Persönlichkeitsrechte oder Urheberrechte solcher «künstlicher Intelligenzen» stehe. Es bietet sich daher an, die sich rund um dieses Thema anfallenden Fragen einmal anzuschauen. Der vorliegende Text beschränkt sich auf die urheber- und datenbankrechtlichen Themen.

1.

Was ist machine learning? ^

1.1.

Begriffliches ^

[2]

Vorab ist festzuhalten, dass der Begriff «künstliche Intelligenz» (KI) oder «artificial intelligence» (AI) problematisch ist. Vorliegend wird der Begriff des «machine learning» verwendet, denn er suggeriert dem unvoreingenommenen Leser nicht gleich als Erstes, dass die involvierten Computer eine Art «Eigenintelligenz» oder gar «Seele» entwickeln würden.

1.2.

Trainieren statt programmieren ^

[3]

Im Wesentlichen geht es bei machine learning um eine moderne Methode, Computern beizubringen, bestimmte Aufgaben zu erledigen. Anstatt Computer zu diesem Zweck mit Code zu steuern, der durch Menschen (evtl. auch unter Zuhilfenahme von automatisierenden Hilfsmitteln) erstellt wird, lässt man Computer die jeweiligen Aufgaben selber «erlernen». Der grosse Vorteil ist dabei, dass auf diese Weise sehr komplexe Aufgaben gelöst werden können. Mit der zunehmenden Leistungsfähigkeit von Computern und der Entwicklung von auf machine learning spezialisierter Hardware1 wurde es seit einigen Jahren beispielsweise möglich, die in biologischen Gehirnen zu beobachtenden Strukturen mit Neuronen und beim Lernen entstehenden Verbindungen zwischen diesen («neuronale Netze») in gewisser Weise zu simulieren.2

1.3.

Neuronale Netze ^

[4]

Der in diesem Zusammenhang ebenfalls verwendete Begriff des «deep learning» bringt zum Ausdruck, dass in diesen künstlichen neuronalen Netzen zwischen der Eingabe- und der Ausgabeschicht zahlreiche «Zwischenlagen» mit untereinander verschalteten künstlichen Neuronen (englisch hidden layers) Einsatz finden. Die Systeme weisen dadurch eine «tiefe» innere Struktur auf.3

Links: Die Eingangsschicht (input layer) mit in diesem Fall drei Eingangsneuronen. Rechts: Die Ausgabeschicht mit den in diesem Fall zwei Ausgangsneuronen. Mitte: Die mittlere Schicht wird als verborgen bezeichnet (hidden layer), da ihre Neuronen weder Eingänge noch Ausgänge sind. In diesem Bild ist nur eine verborgene Schicht zu sehen, in der Praxis weisen neuronale Netzwerke jedoch eine Vielzahl von verborgenen Schichten auf (Bild und Grundlage des Begleittexts: Wikipedia, Deep Learning, CC BY-SA 3.0).

[5]

Im Rahmen des «Trainings» solcher Systeme werden Verbindungen zwischen den Neuronen hergestellt, unterbrochen, gestärkt oder geschwächt, ähnlich wie dies in biologischen Gehirnen der Fall ist. Darin besteht die eigentliche «Speicherung» des Lerninhaltes; der «Speicher» besteht demnach aus der Gesamtheit der durch den Lernvorgang entstandenen Neuronen und den Verbindungen in ihrer jeweiligen Stärke.4

[6]

Das Anlernen funktioniert je nach Konzept unterschiedlich. Zumeist geht es darum, dem neuronalen Netz vorklassifizierten Input vorzulegen (etwa Bilder von Pferden und Katzen, die bereits als solche gekennzeichnet sind). Das Netz wird anhand dieses vorklassifizierten Inputs angelernt und kann in der Folge bei neuen, ihm noch nicht bekannten Bildern von Pferden und Katzen selber bestimmen, auf welchem Bild ein Pferd und auf welchem eine Katze abgebildet ist. In vergleichbarer, wenn auch viel komplexerer Weise, werden beispielsweise Rechner für autonomes Fahren «trainiert», indem ihnen für bestimmte durch Sensoren (Kameras, Ultraschall, Radar, teils auch Lidar) erfasste Konstellationen die richtige Reaktionsweise vorgeführt wird.5

[7]

Wesentlich für machine learning ist dabei, dass die Vorgänge und Entscheidungsvorgänge im neuronalen Netz und dessen innere Struktur nach heutigem Stand der Wissenschaft nicht nachvollziehbar sind. Es handelt sich also um eine Art «Black Box».

1.4.

Stand der Technik ^

[8]

Die Fortschritte, die durch diese Technologie in den letzten Jahren erreicht wurden, sind frappant. Wer beispielsweise die Übersetzungsmaschine deepl.com kennt, weiss, wovon hier die Rede ist.

[9]

Dennoch ist festzuhalten, dass machine learning bis heute auf einzelne, sehr spezialisierte Aufgaben beschränkt ist (wie etwa Bild- und Spracherkennung, Übersetzungen, autonome Fahrzeuge), und dass man keineswegs von einer «universellen Intelligenz» ausgehen darf, wie sie der Begriff der künstlichen Intelligenz suggeriert. Von einer derartigen «starken KI» (im Gegensatz zur heutigen «schwachen KI») ist die Entwicklung noch sehr weit entfernt. Die auch in der juristischen Literatur teils diskutierte Forderung nach irgendwie gearteten Persönlichkeitsrechten für KI-Systeme gehört demnach ins Reich des Science Fiction und basiert auf einem falschen Verständnis der technischen Realitäten.

[10]

Die Qualität der Ergebnisse hängt dabei zu einem grossen Teil von der Qualität der vorklassifizierten Input-Daten ab. Entsprechend stellt das Zusammenstellen der Trainingsdaten regelmässig einen erheblichen Teil des Aufwandes dar. Unternehmen, die über eine grosse, qualitativ gute Datenbasis verfügen, gelten gemeinhin als für den Kampf um die Marktvorherrschaft im Bereich machine Learning besser gerüstet («Data is the new Oil»).

2.

Rechtliche Aspekte von machine learning ^

[11]

Rechtliche Aspekte von machine learning gibt es viele. Vorliegend soll auf urheber- und datenbankrechtliche Fragen eingegangen werden.

2.1.

Urheberrecht ^

[12]

Die eingangs gestellte Frage, ob derartige «künstliche Intelligenzen» etwa selber Urheberrechte an durch sie geschaffenen Werken erlangen können, ist einfach zu beantworten: Sie können es nicht. Hintergrund ist der urheberrechtliche Werkbegriff von Art. 2 Abs. 1 Urheberrechtsgesetz, gemäss dem ein Werk eine «geistige Schöpfung» sein muss. Der Begriff der «geistigen Schöpfung» ist dabei beschränkt auf den «Output» des menschlichen Geistes (vgl. auch Art. 6 URG).

[13]

Ergebnisse von Computerprogrammen, seien sie nun herkömmlich durch Programmierung von Code entstanden oder durch machine learning, geniessen grundsätzlich keinen Urheberrechtsschutz, weil sie keine Werke im Rechtssinne sind.6

[14]

Anders ist die Situation, wenn der Mensch sich des Computers als Werkzeug bedient hat, um ein Werk zu schaffen (also etwa eines Zeichenprogramms), oder auch, wenn er ein Programm schreibt, das einen relativ eng determinierten Output hat. Wenn ein menschlicher Autor einem lernenden System jedoch beibringt, bestimmte Arten von Werken (Bilder, Musik u.dgl.) zu schaffen, die jedoch bei der Programmierung nicht vorhersehbar sind (Kontingenz), tritt die menschliche Schöpfung in den Hintergrund.7 Die Situation ist ähnlich wie bei einem Lehrer, der einem Schüler eine Technik beibringt, sich künstlerisch auszudrücken, aber in der Folge an den vom Schüler geschaffenen Werken kein Urheberrecht mehr besitzt.

[15]

Sodann ist festzuhalten, dass die Software, aus der das neuronale Netz besteht, also die Algorithmen, die den beschriebenen Lernvorgang mit Neuronen und Verbindungen implementieren, selbstverständlich Urheberrechtsschutz geniesst (Art. 2 Abs. 3 URG).

[16]

Die Software des neuronalen Netzes ist jedoch strikt zu trennen vom Ergebnis des Anlernens des Netzes. Weitaus interessanter ist denn auch die Frage, ob für ein im geschilderten Sinne «trainiertes» neuronales Netz, also die Datenbank, die nach dem Training des neuronalen Netzes entstanden ist, welche die Neuronen mit ihren (gewichteten) Verbindungen enthält, Schutz beansprucht werden könnte. Der Aufwand für das Training eines solchen Netzes kann jedenfalls sehr erheblich sein, weshalb ein Ausschliesslichkeitsrecht für den Schöpfer interessant sein könnte.

[17]

Zunächst ist zu fragen, ob das Urheberrecht einen Schutz eines solchen trainierten neuronalen Netzes gewähren kann.

[18]

Datenbanken können als Sammelwerke urheberrechtlich geschützt sein, sofern es sich bezüglich der Auswahl der gesammelten Daten um eine geistige Schöpfung mit individuellem Charakter handelt (Art. 4 Abs. 1 URG). Das Auswählen der Trainingsdaten kann mithin zu einem Werk führen, wenn darin ein hinreichend individueller menschlicher Schöpfungsakt zu sehen ist. Werden Daten hingegen automatisch zusammengestellt, liegt bereits bei den Trainingsdaten kein urheberrechtlich geschütztes Werk vor.

[19]

Liegt bei der Sammlung ein geschütztes Werk vor, so fragt es sich, ob ein anhand dieses Werks trainiertes neuronales Netz allenfalls als Werk zweiter Hand verstanden werden könnte.

[20]

Werke zweiter Hand sind geistige Schöpfungen mit individuellem Charakter, die unter Verwendung bestehender Werke so geschaffen werden, dass die verwendeten Werke in ihrem individuellen Charakter erkennbar bleiben (Art. 3 Abs. 1 URG).

[21]

Problematisch ist dabei, dass das neuronale Netzwerk im Rahmen des Lernprozesses seine Strukturen automatisch den gelernten Inhalten anpasst. Die Struktur des Netzes mit seinen Neuronen und unterschiedlich betonten Verbindungen ist nicht menschgemacht, sondern gerade das Ergebnis des machine learning.

[22]

Damit liegt mit einiger Wahrscheinlichkeit kein Werk zweiter Hand vor. Ein Urheberrechtsschutz entfällt.8

2.2.

Datenbankrecht ^

[23]

Nach dem Recht der Europäischen Union (nicht aber der Schweiz) könnte demgegenüber Schutz bestehen, wenn auch nicht gestützt auf das Urheberrecht, sondern in der Form des «Sui-Generis-Rechts» (Rechts eigener Art), das sich aus der europäischen Datenbankrichtlinie 96/9/EG (DBRL) ergibt.

[24]

Eine «Datenbank» ist gemäss Art. 1 Abs. 2 DBRL eine Sammlung von Werken, Daten oder anderen unabhängigen Elementen, die systematisch oder methodisch angeordnet und einzeln mit elektronischen Mitteln oder auf andere Weise zugänglich sind. Der Sui-Generis-Schutz von Datenbanken hängt zudem davon ab, dass für die Erstellung der Datenbank eine in qualitativer oder quantitativer Hinsicht wesentliche Investition erforderlich ist (Art. 7 Abs. 1 DBRL). Die Investition muss dabei für das Schaffen der Datenbank selber erforderlich sein. Es reicht nicht, wenn nur das Beschaffen der Daten eine Investition erfordert.9

[25]

Das neuronale Netz ist letztlich eine Sammlung von Daten (nämlich der Informationen über die Neuronen, den zwischen diesen durch das machine learning geschaffenen Verbindungen und deren jeweiligen Gewichtung). Diese sind systematisch oder methodisch angeordnet (die in Ziffer 1.3 genannte Zwischenstruktur mit Schichten von Neuronen).

[26]

Die für das Training eines neuronalen Netzwerks verwendeten Daten können das Ergebnis einer systematischen Sammlung und damit sogar urheberrechtlich, in jedem Fall aber datenbankrechtlich schutzfähig sein. Die systematische Auswahl geeigneter Trainingsdaten ist sogar die Basis für den Erfolg von machine learning. Zudem ist die dem neuronalen Netz zugrunde liegende Investition regelmäßig auf die Organisation von Daten ausgerichtet (durch das Training des Netzes werden die Daten strukturiert). Damit ist auch das Erfordernis der Investition erfüllt. Dies spricht für eine Anwendbarkeit des Sui-Generis-Rechts auf trainierte neuronale Netze.10

[27]

Problematisch ist hingegen m.E. das Kriterium der individuellen Zugänglichkeit der Daten in einer Datenbank: Nur wenn von einer solchen Zugänglichkeit ausgegangen werden kann, liegt gemäss dem Europäischen Gerichtshof EuGH eine Datenbank im Sinne der Richtlinie vor.11

[28]

Im Prinzip sind die einzelnen Elemente des Netzes (Neuronen, Verbindungen) zwar individuell auslesbar. Nur sind diese einzelnen Elemente für die Verwendung des Netzes insofern nicht relevant, als das Netz seinen Nutzen nur als Ganzes ausspielt, genauso wie die Neuronen eines menschlichen Gehirns für sich allein keinen Schluss auf die im Gehirn gespeicherte Information zulassen, sondern die Information nur durch das Zusammenspiel mit einer Vielzahl anderer Neuronen aus dem Netz extrahiert werden kann. Das Netz ist wie gesagt eine Black Box, die einzelnen Informationen daraus sind für seine Nutzung wertlos.

[29]

Dadurch unterscheidet sich der aus dem Training eines neuronalen Netzes resultierende Datensatz von einer «Datenbank» im Rechtssinn, deren Elemente sich voneinander trennen lassen, ohne dass, wie der EuGH es voraussetzt, «der Wert ihres informativen, literarischen, künstlerischen, musikalischen oder sonstigen Inhalts dadurch beeinträchtigt wird».12 Auch wenn der EuGH insofern einen grosszügigen Massstab angelegt hat, indem er zur Beurteilung des selbstständigen Informationswerts eines aus einer Sammlung herausgelösten Elements nicht auf die Perspektive des typischen Nutzers der betreffenden Sammlung abstellt, sondern auf einen beliebigen Dritten, der sich für das herausgelöste Element interessiert,13 ändert sich daran nichts: Der Zustand eines einzelnen Neurons oder einer einzelnen Verbindung eines neuronalen Netzes ist für niemanden von Interesse.14

[30]

Demnach scheint die Anwendbarkeit des Sui-Generis-Datenbankschutzes auf neuronale Netze zumindest zweifelhaft.

2.3.

Schlussbemerkung ^

[31]

Es fragt sich, ob die Schaffung eines urheber- oder datenbankrechtlichen Schutzes neuronaler Netzwerke überhaupt erstrebenswert ist. In der Praxis sind derartige Netzwerke Gegenstand dauernden Trainings. Ein Unternehmen, das ein trainiertes neuronales Netz von einem Dritten kopiert, um es in der Folge selber zu nutzen, gewinnt nur einen statischen «Schnappschuss» des neuronalen Netzwerks. Die Herstellerin des Originals dürfte aufgrund der steten Weiterentwicklung und der nur ihr bekannten Trainingsmethoden innert kürzester Zeit wieder einen Vorsprung erreichen. Entsprechend dürfte sich ein urheber- oder datenbankrechtlicher Schutz oft erübrigen.

Simon Schlauri

  1. 1 Dazu sei etwa auf die lehrreiche Darstellung von Tesla, Inc. an der Investorenveranstaltung «Autonomy Day» vom 22. April 2019 verwiesen, youtube.com/watch?v=Ucp0TTmvqOE (ab Minute 1:09; die Präsentation dauert rund 2.5 Stunden).
  2. 2 Zum Ganzen etwa Wikipedia, Künstliches neuronales Netz, tinyurl.com/y4hpaft5.
  3. 3 Vgl. etwa Wikipedia (Englisch), Deep Learning, Abschnitt «Overview», tinyurl.com/yyof37pu.
  4. 4 Vgl. Wikipedia Englisch (FN 3), Abschnitt «Artificial Neural Networks».
  5. 5 Dazu die Schilderung bei Tesla, Inc. (FN 1), ab Minute 1:51.
  6. 6 SHK-Hug, N 4 zu Art. 6 URG.
  7. 7 Vgl. Sven Hetmank/Anne Lauber-Rönsberg, GRUR 2018, 574 ff., 577.
  8. 8 So für das deutsche Recht Hetmank/Lauber-Rönsberg (FN 7) 577.
  9. 9 Vgl. etwa EuGH, GRUR 2005, 244 Rn. 31 – BHB-Pferdewetten; Hetmank/Lauber-Rönsberg (FN 7), 578.
  10. 10 Befürwortend Cristiana Sappa, GRUR Int. 2019, 135 ff., 142.
  11. 11 EuGH, GRUR 2015, 1187 Rn. 17 – Freistaat Bayern/Verlag Esterbauer.
  12. 12 A.a.O.
  13. 13 EuGH, a.a.O., Rn. 27.
  14. 14 Anders Hetmank/Lauber-Rönsberg (FN 7), 578, die davon ausgehen, dass einzelne Elemente dereinst einen Wert für sich haben könnten, aber das Wesen eines neuronalen Netzes wohl verkennen, wenn sie als unterstützendes Beispiel einzelne Elemente einer topografischen Karte nennen.