Jusletter IT

KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik

Author: Diogo Campos Sasdelli
Category of articles: Security and Law
Region: Czech Republic, EU
Field of law: Security and Law
Collection: Conference proceedings IRIS 2022
DOI: 10.38023/76692828-9da1-469a-8310-10fd68db582e
Citation: Diogo Campos Sasdelli, KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik, in: Jusletter IT 30 June 2022

Reinforcement Learning zählt aktuell zu den beliebtesten Ansätzen im Bereich des Machine Learning. Hierbei geht es um den Ansatz, eine Art Belohnungsfunktion zu bestimmen, die der Maschine je nach ihrem Verhalten einen bestimmten Belohnungswert zuordnet. Die Maschine strebt an, diesen Wert zu maximieren. Der normative Charakter dieses Ansatzes springt in die Augen. In diesem Aufsatz wird gezeigt, dass einige Probleme, die im Zusammenhang mit Reinforcement Learning auftauchen (Reward Hacking) sehr enge strukturelle Verwandtschaften mit den sog. Paradoxa der Normenlogik aufweisen.

1. Prolegomena
1.1. Die Normenlogik und ihre Paradoxa
1.2. Neuronale Netze, maschinelles Lernen, Reinforcement Learning
2. KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik
3. Schluss
4. Literatur

Kontakt

Jusletter IT

KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik

Table of contents

Lawjobs

News@Weblaw

Per§onalia

Editions Weblaw

Services

Weblaw Inside

Competence

LegalTech

DocEngine

Loggen Sie sich bitte ein!

Angemeldet als

Lawsearch

Kontakt

Jusletter IT

KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik

Table of contents

Lawjobs

News@Weblaw

Per§onalia

Editions Weblaw

Services

Weblaw Inside

Competence

LegalTech

DocEngine

Community

Verlag

Weiterbildung

Produkte

Hotlinks