1.
Vorbemerkung ^
In diesem Beitrag geht es um «Inference to the Best Explanation» (kurz: «IBE»), was so viel wie den Schluss auf die beste Erklärung (Details dazu siehe weiter unten) meint. In der einschlägigen Literatur1 werden solche und andere Fragen der formalen oder informellen Logik meist ausgehend von einzelnen Behauptungen oder linearen Behauptungssequenzen diskutiert, obwohl (nicht nur) IBE die Gegenüberstellung von alternativen Behauptungen bzw. Behauptungssequenzen, also Populationen von Behauptungen, voraussetzt. Da der Populationsbegriff jedoch definierte Beziehungen zwischen den einzelnen Elementen bzw. Agenten nicht notwendig impliziert, benötigt man zusätzlich eine Struktur, wie sie zum Beispiel vom Begriff des Netzwerks umfasst wird. Ziel dieses Beitrags ist es daher, IBE in einem in einer Population von Behauptungen angenommenen Behauptungs-Netzwerk abzubilden. Der vorliegende Text ist dabei nicht abschließend, sondern als «1.0-Version» gedacht, an der im Rahmen weiterer Forschungen noch zu arbeiten ist. Außerdem geht es dabei weniger um die Diskussion der Eigenschaften dieser Zusammenhänge bzw. die Rechtfertigung oder Widerlegung einzelner Sätze darüber, sondern um die Illustration der Zusammenhänge in einem einheitlichen, grafischen System. Der Beitrag besteht deshalb aus zwei Hauptteilen: (1.) wird ein simples grafisches protologisches System vorgestellt, und (2.) wird anhand eines Beispiels gezeigt, wie sich IBE darin abbilden und diskutieren lässt.
2.
Ein simples, grafisches protologisches System ^
2.1.
Protologische Grundlagen ^
- Knotenpunkten
- Kanten
- Operationsinformationen
@ Knotenpunkte: Als Knotenpunkte dienen wohlgeformte Formeln («well formed formulas», kurz: «WFF»), die gemäß dem etablierten Regeln der gegenwärtigen Aussagenlogik gebildet werden (also beispielsweise: «p», «q», «¬p», «p ∨ q», «p → q» etc.). Wir nehmen an, dass jede WFF als Behauptung aufzufassen ist und umgekehrt wird jede Behauptung im System als WFF abgebildet. Kursiv gesetzte WFF sind nur im Sinne einer Erwähnung zu sehen (man denke an Freges «Inhaltsstrich»), normal gesetzte WFF werden im Sinne eines formalen Korrespondenzparameters verstanden. Dazu sogleich weiter unten.
@ Kanten: Hier sind folgende vier Arten zu unterscheiden:
- Netzwerkbeziehungskanten: Durch verbundene Linien («––») gekennzeichnete Kanten zeigen an, dass mindestens zwei damit verbundene WFF miteinander in irgendeiner Beziehung stehen. Im einfachsten Fall bedeutet das lediglich die Zugehörigkeit zum selben Netzwerk. Durch Operationsinformationen können die Beziehungen beliebig definiert werden. Diese Kanten können auch Y-förmig verzweigt werden, um Beziehungen zwischen mehreren Elementen darzustellen.
- Formungskanten: Die mit «→» gekennzeichneten Kanten zeigen an, dass aus einer WFF im Wege einer Formungsoperation gemäß den etablierten Regeln der Aussagenlogik eine andere WFF geformt wird. Diese zugegebenermaßen vage Formulierung soll auch ausdrücken, dass dies hier nicht weiter vertieft werden soll, da es für das hier zu entwickelnde Gedankenmodell nicht wesentlich ist. Auch diese Pfeile können Y-förmig verzweigt werden und zwar genau dann, wenn aus mindestens zwei WFF eine einzige geformt oder eine solche zerlegt wird. Die Formungsart wird immer als Operationsinformation neben die Pfeile geschrieben.
- Schlusskanten: Mit «⇒» gekennzeichneten Kanten zeigen eine Folgerungsoperation an und entsprechen damit dem Zeichen «∴» (bzw. bei manchen Systemen auch «⇒», «⊢» oder «⊨»). Auch diese Pfeile können Y-förmig verzweigt werden.
- Verschiebekanten: Durch gestrichelte Linien («----») gezeichnete Kanten zeigen an, dass eine WFF in der Grafik aus rein optischen Gründen verschoben wird, damit sie visuell harmonischer mit anderen visuellen Elementen kombiniert werden kann. Auch hier ist Y-förmige Verzweigung möglich.
Wie ersichtlich illustriert die Grafik 1 ein beliebiges Netzwerkbeispiel innerhalb unseres Systems, und Grafik 2 den Modus Ponens. Die Behauptungen «p» und «q» werden dabei zunächst in Form einer materiellen Implikation kombiniert und dann nochmals mit der Behauptung p. Dabei werden p → q und p via Korrespondenzoperation als korrespondierend angenommen (nicht aber natürlich q). Daraus darf man dann auf q schließen, d.h. als korrespondierend annehmen.
2.2.
Wahrscheinlichkeits- und Kohärenzgrade von WFF ^
- Wahrscheinlichkeitsgrade
- Kohärenzgrade
@ Wahrscheinlichkeitsgrade: Es ist sinnvoll, WFF – und damit Behauptungen – unterschiedliche Wahrscheinlichkeitsgrade zuzuweisen, d.h. quantifizierte Grade der Wahrscheinlichkeit, mit der sie parametrisch korrespondieren (zu dem Begriff siehe oben). Aus welcher Quelle – auch hier gehen wir von einer eingreifenden bzw. zuordnenden Beobachter_in aus – diese Zuordnung stammt, ist dabei sekundär. In der juristischen Praxis beispielsweise wird trivialer Weise die Frage eine Rolle spielen, ob und wie Behauptungen belegt sind, was in der Praxis von einer Richter_in anhand kriminaltechnischer Belege bis hin zum allgemeinen Alltagswissen vorgenommen wird. Hier soll im Weiteren folgende Kategorisierung verwendet werden
- Hoch unwahrscheinlich: ⊖⊖
- Unwahrscheinlich: ⊖
- Zu 50% wahrscheinlich bzw. unwahrscheinlich: ⊙
- Wahrscheinlich: ⊕
- Hoch wahrscheinlich: ⊕⊕
@ Kohärenzgrade: Auch die Kohärenz, also die Widerspruchsfreiheit zwischen zwei WFF, muss abgebildet werden können. Auch hier ist die Zuordnung – z.B. wieder durch eingreifende Beobachter_innen – variabel. Folgende Kohärenzgrade sollen unterschieden werden.
- Sehr niedrige Kohärenz (= sehr hohe Inkohärenz): – –
- Niedrige Kohärenz: –
- Zu 50% kohärent bzw. inkohärent: 0
- Kohärent: +
- Sehr hohe Kohärenz: ++
Insgesamt gibt es folgende 25 Möglichkeiten der Kombination von Wahrscheinlichkeits- und Kohärenzgraden:
Kombinationsmöglichkeiten | Konsistenzstufen | |||||
– – | – | 0 | + | ++ | ||
| ⊖⊖ | ⊖⊖– – | ⊖⊖– | ⊖⊖0 | ⊖⊖+ | ⊖⊖++ |
⊖ | ⊖– – | ⊖– | ⊖0 | ⊖+ | ⊖++ | |
⊙ | ⊙– – | ⊙– | ⊙0 | ⊙+ | ⊙++ | |
⊕ | ⊕– – | ⊕– | ⊕0 | ⊕+ | ⊕++ | |
⊕⊕ | ⊕⊕– – | ⊕⊕– | ⊕⊕0 | ⊕⊕+ | ⊕⊕++ |
- Fallgruppe 1 («starke positive Kohärenz») meint starke Kohärenz von WFF1 mit einer hoch wahrscheinlichen WFF0. Dabei ist zu beachten, dass WFF1 dadurch für die Gesamtbetrachtung dennoch nicht notwendig wahrscheinlicher wird, weil WFF0 dafür auch irrelevant sein kann, was auf dieser Stufe im System aber nicht abgebildet wird.5
- Fallgruppe 2 («starke Kontrakohärenz») bedeutet starke Inkohärenz von WFF1 mit einer hoch wahrscheinlichen WFF0: Sofern die WFF0 nicht völlig irrelevant ist, ist WFF1 damit als unwahrscheinlich anzunehmen und zu verwerfen. Man beachte, dass Fallgruppe 1 und 2 also nicht symmetrisch sind, sondern dass das «Falsifizierungspotential» starker Inkohärenz größer ist als das «Verifizierungspotential» starker Kohärenz.
- Fallgruppe 3 («Irrelevante Kohärenz») umfasst starke, mittlere oder schwache Kohärenz oder Inkohärenz von WFF1 mit einer mittel oder schwach wahrscheinlichen oder unwahrscheinlichen WFF0. In der Wirtschaft würde man das als «waste of money» bezeichnen, weil jede Kohärenz oder Inkohärenz mit mittel oder schwach wahrscheinlichen oder unwahrscheinlichen anderen WFF für die Gesamtbewertung irrelevant ist.
- Fallgruppe 4 («Insignifikanz») meint schwache oder mittlere Kohärenz oder Inkohärenz von WFF1 mit einer stark, mittel oder schwach wahrscheinlichen oder unwahrscheinlichen WFF0: Dies ist nicht signifikant und berechtigt zu praktisch keinen Schlüssen für die Gesamtbetrachtung.
3.1.
IBE als Rationalitätsmethode ^
Auch die professionelle Reflexion über das Tun und Treiben der Wissenschaften – also die Wissenschaftstheorie, so wie wir sie heute kennen – kam erst relativ spät auf, und zwar im Grunde erst mit dem Positivismus des 19. Jahrhunderts. Dieser wiederum setzte – in eher unreflektierter Art und Weise – auf Verifikation (d.h. die Affirmation von Behauptungen) im Allgemeinen und Induktion (d.h. den «Schluss» vom Einzelfall auf ein allgemeines Prinzip) bei der Rechtfertigung von Prinzipien. Nicht unerwähnt darf man in diesem Zusammenhang aber auch die zur selben Zeit erfolgte «Entdeckung» des später noch anzusprechenden Schemas der Abduktion lassen, was jedoch zunächst ohne Einfluss blieb.
Abduktion wird oft durch die (deduktiv ungültige) Formel: «A → B, B ∴ A» abgebildet. Abduktion ist dabei allerdings lediglich ein inventives Schema, das als Heuristik zur Findung neuer Ideen dienen kann. Anders als etwa beim Modus Ponens oder Modus Tollens können die Prämissen alleine die Konklusion jedoch nicht äquivalent rechtfertigen8. Auch darauf soll hier nicht weiter eingegangen werden.
Das 1965 von Gilbert H. Harman10 in die philosophische Diskussion eingeführte IBE-Schema hat den Vorteil, dass es im Gegensatz zum Bayes-Theorem auch in einem nicht völlig quantifizierten Setting betrieben werden kann, weil keine Zahlen notwendig sind, d.h. dass man Wahrscheinlichkeits- und Kohärenzgrade auch informell zuweisen kann und dennoch ein Ergebnis erhält. Im Gegensatz zum Abduktions-Schema ist der Rechtfertigungscharakter von IBE nicht a priori auszuschließen, in folgender schwachen Formulierung in der Tat sogar vorsichtig zu bejahen, was sich so formulieren lässt:
Theorem 1: Nach solidem und fairem Kohärenztestverfahren aller zum Zeitpunkt t verfügbaren erklärenden Hypothesen (H1 ... Hn) bezüglich einer Fragestellung anhand der die Fragestellung betreffenden verfügbaren Fakten-Behauptungen (F1 ... Fn) sowie der sich aus den Fundamentalsätzen des gegenwärtigen Standes der Wissenschaften ergebenden Behauptungen ist die Annahme der Korrespondenz der am wenigsten schlecht abschneidenden Hypothese/-n zum Zeitpunkt t rational nicht weniger gerechtfertigt, als die Annahme der Fakt-Behauptungen und wissenschaftlichen Fundamentalsätze selbst.
3.2.
Ein Beispiel: Der Mord an Lord Thomas Picton ^
Um IBE im Netzwerk zu zeigen, werden wir aus dem gerade skizzierten System nur bestimmte Teile heraus zeichnen und den Rest unbeachtet lassen. Hier interessieren nur die Folgerungen und die Beziehungen zwischen den WFF, nicht aber deren Formung. Wir nehmen zur Illustration folgenden Sachverhalt an:
Lord Thomas Picton (57), ehemaliger Offizier der Royal Army, wurde am 18. Juni 2015 um ziemlich genau fünf Uhr Abends im «Waterloozimmer» seines Landsitzes mit einem alten Militärsäbel erstochen. Lady Picton (40) befand sich nach ihrer Aussage zu diesem Zeitpunkt auf dem Rückweg von ihrem Anwalt in London, mit dem sie über ihre geplante Scheidung gesprochen hatte. Um 16:30 h wurde sie in ihrem Aston Martin ca. 200 Meilen von ihrem Haus entfernt von einer Radarfalle fotografiert. Butler James (56) inspizierte nach seinen Angaben gerade die Inneneinrichtung des großen Salons, als er von ferne ein Stöhnen und dann einen zu Boden fallen Körper hörte. Das Stubenmädchen, Miss Milchrest (28), gab an, sich zwischen halb fünf und sechs in ihrer Kammer befunden und mit ihrer Schwester über ihre Geldsorgen telefonierte zu haben, gesehen oder gehört hätte sie aber nichts. Wer war der/die Täter_in?
- HLAD: Lady Picton ist die Mörderin
- HBUT: Butler James ist der Mörder
- HMIL: Miss Milchrest ist die Mörderin
Die Grafik zeigt mehrere Anhaltspunkte für eine «Lösung» im Sinne einer IBE, und zwar:
- HLAD hat zweimal die höchste Kontrakohärenz-Bewertung, nämlich «⊕⊕– –». Damit ist diese Hypothese trotz einer aus dem Umstand der Scheidungsabsicht herrührenden Motivmöglichkeit auszuschließen.
- Weder HBUT noch HMIL haben ähnlich substanzielle Ausschließungsgründe, weshalb eine graduelle Beurteilung – sozusagen die Frage nach einem «Sieg nach Punkten» – durchzuführen ist. Dabei ist im Sinne des oben Gesagten primär auf die mit ⊕⊕ bewerteten Fakt-Behauptungen einzugehen, und dabei zeigt sich, dass HBUT hier die höhere Bewertung hat, nämlich insgesamt «++++++ 000» gegenüber «++ 00000». Da oben angenommen wurde, dass genau eine der drei Hypothesen zutrifft, stehen HBUT und HMIL nach dem Ausscheiden von HLAD in kontradiktorischem Gegensatz und man muss sich für eine der beiden entscheiden. Hierbei spricht mehr für HBUT. Das bedeutet, dass zum jetzigen Zeitpunkt die (im Rahmen der Maßstäbe des modernen Strafrechts natürlich nicht auseichende) beste Erklärung lautet: Butler James ist der Mörder.
4.
Zusammenfassung ^
5.
Literatur ^
Amaya, Amalia, Inference to the Best Legal Explanation. In: Kaptein, Hendrik/Prakken, Henry/Verheij, Bart (Eds.), Legal Evidence and Proof: Statistics, Stories, Aldershot, 2009.
Garfinkel, Alan, Forms of Explanation: Rethinking the Questions in Social Theory, New Haven et al., 1981.
Harman, Gilbert H., The Inference to the Best Explanation. In: Philosophical Review, Bd. 74 (1), 1965, 88–95.
Klärner, Holger, Der Schluss auf die beste Erklärung, Berlin/New York, 2003.
Klement, Kevin, Propositional Logic. In: Fieser, James/Dowden, Bradley (Eds.): Internet Encyclopedia of Philosophy, http://www.iep.utm.edu/prop-log/ (zugegriffen am 10. Januar 2016), 2016.
Kreuzbauer, Hanna Maria*, Ilmar Tammelos und Helmut Schreiners «Protologischer Kalkül». In: Schweighofer, Erich/Menzel, Thomas/Kreuzbauer, Hanna Maria (Eds.), IT in Recht und Staat: Aktuelle Fragestellungen der Rechtsinformatik, Wien, 2002, 285–296. [*Man beachte die Namensänderung]
Lipton, Peter, Inference to the Best Explanation, 2. Aufl., London/New York, 2004.
Mayes, Randolph, Theories of Explanation, In: Fieser, James/Dowden, Bradley (Eds.): Internet Encyclopedia of Philosophy, http://www.iep.utm.edu/explanat/ (zugegriffen am 10. Januar 2016), 2016.
Okasha, Samir, Van Fraassen’s Critique of Inference to the Best Explanation. In: Studies in History an Philosophy of Science, Bd. 31 (4), 2000, 691–710.
Tammelo, Ilmar/Schreiner, Helmut, Grundzüge und Grundverfahren der Rechtslogik, Bd. 1, Pullach bei München, 1974.
Tammelo, Ilmar/Schreiner, Helmut, Grundzüge und Grundverfahren der Rechtslogik, Bd. 2, Pullach bei München, 1977.
Timmer, Sjoerd T./ Meyer, John-Jules Ch./Prakken, Henry/Renooij, Silja/Verheij, Bart., Explaining Legal Bayesian Networks Using Support Graphs. In: Rotolo, Antonio (Ed.), JURIX 2015, Legal Knowledge and Information Systems, Amsterdam, 2015, 121– 130.
Van Fraassen, Bas, The Scientific Image, Oxford, 1980.
Van Fraassen, Bas, Laws an Symmetry, Oxford, 1989.
Vlek, Charlotte S./Prakken, Henry/Renooij, Silja/Verheij, Bart, Building Bayesian Networks for Legal Evidence with Narratives: A Case Study Evaluation, Artificial Intelligence an Law, Bd. 22, 2014, 375–421.
Vlek, Charlotte S./Prakken, Henry/Renooij, Silja/Verheij, Bart, Constructing and Understanding Bayesian Networks for Legal Evidence with Scenario Schemes. In: Sichelman, Ted/Atkinson, Katie (Eds.): Proceedings of the 15th International Conference on Artificial Intelligence and Law, ICAIL 2015, San Diego, CA, USA, June 8–12, 2015, 128–137.
Woodward, James, Scientific Explanation. In: Zalta, Edward N., Stanford Encyclopedia of Philosophy, http://plato.stanford.edu/archives/win2014/entries/scientific-explanation/ (zugegriffen am 10. Januar 2016), 2014.
- 1 Für viele vgl. Harman 1965 (erste Darstellung), Van Fraassen 1989 (wichtigster kritischer Beitrag), Klärner 2003 (wichtigste deutschsprachige Abhandlung), Lipton 2004 (wichtigste Abhandlung überhaupt) sowie Amaya 2009 (wichtigster Beitrag zur Anwendung in den Rechtswissenschaften).
- 2 Vgl. Schreiner/Tammelo 1974 und 1977 sowie Kreuzbauer 2002.
- 3 Für viele vgl. Klement 2016.
- 4 Auf Quantifizierung wird in dieser Ausbaustufe verzichtet.
- 5 Man vergleiche dazu Bas van Fraassens (1989) analoges Argument vom «bad lot» (vgl. Okasha 2000, 694ff.).
- 6 Im Bereich von Werten und Normen ist es jedoch ähnlich.
- 7 Wie auch immer man diese beiden Dimensionen physikalisch versteht.
- 8 Das heißt genauso rechtfertigen, wie sie selbst gerechtfertigt sind. Man kann in diesem Fall auch vom Potential zur «Konservierung» von Korrespondenz bzw. Wahrheit sprechen.
- 9 Erklärungen (=«Explanation») kann man sich im Rahmen von IBE als Antwort auf eine Frage der Form: «Why this rather than that?» (Lipton 2004, 33, unter Verweis auf Alan Garfinkel 1981, 28–41 und Bas van Fraassen 1980, 126–129) bzw. wie Peter Lipton im Rahmen der Vorstellung seines so genannten «constrastive causal models» schreibt: «Why P rather than not-P?» (Lipton 2004, 49). Zum Begriff der wissenschaftlichen Erklärung allgemein vgl. Woodward 2014 und Mayes 2016.
- 10 Harman 1965.
- 11 Erst nach Fertigstellung des Beitrags wurde die Autorin außerdem auf die Existenz ähnlicher Ansätze im Bereich des Bayesianismus hingewiesen (vgl. dazu für viele Vlek/Prakken/Renooij/Verheij 2014 und 2015, sowie Timmer/Meyer/Prakken/Renooij/Verheij 2015). Um die Gemeinsamkeiten und Unterschiede zwischen beiden Ansätzen zu analysieren sind weitere Forschungen notwendig.