Sehr anschaulich darstellen lässt sich das Bayes'sche Schließen am einfachen Beispiel einer "Krankheit X", zu deren Diagnose ein "Test auf X" existiert. Dabei ist das Testergebnis kausal davon abhängig ob die Krankheit vorliegt oder nicht (sicher nicht umgekehrt).
Das Netz in dieser Weise zu benutzen ist noch wenig spannend, da diese Wahrscheinlichkeiten zur Definition dieses BNs direkt anzugeben sind (siehe bedingte Wahrscheinlichkeitstafeln). Sie können dabei sowohl aus Daten als auch durch Expertenwissen bestimmt werden.
Interessanter sowohl für dieses Beispiel als auch in "Real-Life" ist nun umgekehrt vom Ausgang des Tests auf die Erkrankung zu schließen.
Obwohl die eingebrachte Information intuitiv verständlich
ist verblüfft dieses Ergebnis die meisten Menschen zunächst
- scheint der Test doch auf den ersten Blick eine ziemlich
sichere Aussage zu treffen. Das "Geheimnis" liegt hier
natürlich in der Seltenheit der Krankheit.
Um die Ergebnisse dieses Modells
nachzurechnen reicht die Bayes'sche Formel:
P(A|B) = |
|
|
|
||
P(B)
=
|
|
P(B|A) P(A) |
|
Erst recht bei komplizierteren Zusammenhängen (reale BN's z.B. im medizinischen Bereich haben z.T. hunderte von Merkmalen) rechtfertigt sich die Anwendung von BN's, die zum einen ihr "Wissen" intuitiv verständlich in der Form eines Graphen (globales Wissen) und zum anderen durch bedingte Wahrscheinlichkeiten in Abhängigkeit von den direkten Ursachen (lokales Wissen) repräsentieren. Damit sind BN's kein Black-Box-Verfahren, sondern ermöglichen die Kombination von Expertenwissen und Datenauswertungen (Lernverfahren).
Bayes'sche Netze beachten konsequent die Gesetze der
Wahrscheinlichkeitsrechnung, was auch die innere Konsistenz
des Modells gewährleistet. Im Vergleich zu anderen Verfahren
sehr gut abgebildet wird dadurch z.B. der Explaining-Away-Effekt.
In diesem Beispiel führt die Beobachtung, dass die Straße
nass ist (klick)
zunächst dazu, dass beide Ursachen - Regen und
Wasserrohrbruch - an Wahrscheinlichkeit zunehmen. Im zweiten
Schritt wird aber zusätzlich bekannt, dass es tatsächlich
einen Wasserrohrbruch gegeben hat (klick),
wodurch die Wahrscheinlichkeit für Regen annähernd wieder
auf die A-Priori-Wahrscheinlichkeit von 20% sinkt.
Umgekehrt würde natürlich auch das Wissen, dass es gerade
geregnet hat, die Wahrscheinlichkeit für einen
Wasserrohrbruch wieder fast auf dessen A-Priori-Wahrscheinlichkeit
von hier 5% zurückfallen lassen (zurück).
Dass die Wahrscheinlichkeiten nicht komplett auf den
A-Priori-Wert zurückfallen liegt übrigens daran, dass auch
die Wahrscheinlichkeit, dafür dass beide Ursachen zugleich
eingetreten sind gestiegen ist, wenn auch eben nur ganz
geringfügig.
Ein Problem in der Modellierung von BN's ist die
Kausalitätsannahme, die nicht immer zutreffend ist. Es
müsste auch ungerichtete Verbindungen geben, die keine
Ursache-Wirkung-Beziehung darstellen. Dies ist nur mit einem
kleinen Trick zu realisieren:
Zwei Knoten A und B, die in
einer solchen ungerichteten Beziehung stehen erhalten einen
gemeinsamen Kindknoten. Dieser hat zwei Zustände, hier plausibel
und unplausibel genannt. Alle plausiblen /
unplausiblen Zustandkombinationen der Knoten A
und B sprechen für den jeweiligen Zustand des
Verbindungsknoten. Im gezeigten Beispiel wurden z.B. die
Kombinationen a1,b1 und a2,b2 als plausibel
angenommen während a1,b2 und a2,b1
unplausibel sind.
Der Verbindungsknoten wird immer als Verbindung=plausibel
instanziiert, so dass damit die gewünschte Abhängigkeit
zwischen A und B hergestellt
ist.
Neben Beobachtungen der Art, dass ein einziger Zustand eines Merkmals mit Sicherheit bekannt ist (hard Evidence), kann es auch unsichere Information (soft Evidence) geben.
Ein nettes Beispiel, über das sich (angeblich) selbst Mathe-Profs miteinander in die Wolle geraten sind, ist dieses: Ein Kandidat hat die Wahl zwischen drei verschlossenen Toren. Hinter einem verbirgt sich ein Preis, hinter den andern beiden sind Nieten ("Zonks"). Nachdem der Kandidat ein Tor gewählt hat öffnet der Quizmaster eines der beiden anderen Tore - und zwar eines hinter dem sich der Preis nicht befindet (der Quizmaster weiß also wo der Preis ist). Nun erhält der Kandidat noch einmal die Chance sich umzuentscheiden, also evtl. das andere noch nicht geöffnete Tor zu nehmen. Die Frage lautet nun: Ist es sinnvoller die erste Entscheidung zu ändern oder sie beizubehalten? Die CPT für den Knoten (welches Tor öffnet der) Quizmaster ist dargestellt. Die anderen beiden CPT's enthalten die A-Priori-Wahrscheinlichkeiten für die Wahl (des Kandidaten) und (wo ist der) Preis. Diese liegen jeweils bei 1/3 für jedes Tor. Wenn der Kandidat z.b. zunächst Tor1 wählt (klick) und der Quizmaster dann Tor2 öffnet (klick). Es zeigt sich, dass es sinnvoll ist zu wechseln, da die Wahrscheinlichkeit dass sich der Preis hinter Tor3 befindet nun bei 2/3 zu 1/3 für Tor1 liegt. Alle übrigen möglichen Fälle liefern dasselbe Resultat: Man verdoppelt die Gewinnchanchen, wenn man immer die erste Wahl ändert. Das Beispiel zeigt nochmals wie ein Ergebnis auf das nicht jeder ohne Weiteres kommt mit Hilfe eines BN's berechnet werden kann, das wohl (fast) jeder hätte aufstellen können.
Das sogenannte Simpson-Paradox hat schon in einigen realen - teils recht makabren - Fällen zu (gewollter) Fehlinformation geführt. Auch das hier gezeigte Beispiel ist an einen realen Fall angelehnt - allerdings startk vereinfacht. Die Frage ist: Wo sind die Heilungs-Chancen besser - in Krankenhaus A oder in Krankenhaus B? Man sieht, dass die Chancen in Krankenhaus B (klick) mit 85% besser stehen als in Krankenhaus A (klick) mit (81.67%) Heilungs-Chance. Also in welches Krankenhaus würde man gehen wenn man die Wahl hat? Krankenhaus B? Besser nicht! Die CPT des Merkmals Heilung (rechts unten) die zusätzlich nach der Schwere der Krankheit aufgeschlüsselt ist zeigt deutlich, dass die Chancen sowohl von leichten als auch von schweren Krankheiten geheilt zu werden in Krankenhaus A jeweils 5% besser liegen! Der Effekt rührt daher, dass schwer Kranke eher in Krankenhaus A, leichter Erkrankte eher in Krankenhaus B landen (siehe CPT des Merkmals Krankenhaus; rechts oben). Einfach gesagt: In Krankenhaus A sind mehr schwer Kranke, die die Gesamt-Heilungs-Chancen nach unten ziehen.
Diese Abwandlung des Simpson-Paradoxons ist eine
mögliche Erklärung dafür, wie teilweise erstaunliche Werte
für die Schutzwirkung von Helmen zustande kommen. Wenn man
sich die Daten, die da teilweise benutzt werden nämlich
genauer ansieht, muss einen stutzig machen, dass Helme
offenbar sogar die Beine schützen! Und das wo doch allgemein
bekannt ist, dass jede subjektiv die Sicherheit erhöhende
Einrichtung/Maßnahme immer - zumindest teilweise - durch
eine erhöhte Risikobereitschaft ausgeglichen wird. Belegt
ist z.B., dass Helmträger mit geringen Seitenabständen
überholt werden. Dass sie auch selbst wegen des
vermentlichen Schutzes durch den Helm risikobereiter sind,
ist stark anzunehmen. Dass Unfälle deshalb insgesamt
glimpflicher ausgehen ist sehr unwahrscheinlich.
Das Szenario das hier nun angenommen wird ist folgendes: Es
existieren zwei deutlich unterschiedliche Gruppen von
Radfahrern:
Das obige Netz beschreibt diesen Zusammenhang, wobei ich
hier nicht weiter zwischen Kopf- und anderen Verletzungen,
sondern nur zwischen schweren und leichten Verletzungen
differenziert habe - das wäre möglich, würde das Netz für
dieses Beispiel aber nur unnötig aufblähen. Zu beachten ist,
dass in der Statistik nur Leute auftauchen, die in
Behandlung waren. Wir müssen diese Beobachtung also setzen (klick). Der
Effekt ist dann, dass wir bei schweren (Kopf-)Verletzungen (klick) eher
auf "hat keinen Helm getragen" schließen können während bei
leichten Verletzungen (klick) sich
die Wahrscheinlichkeit in Richtung für das Tragen eines
Helmes verändert. Umgekehrt kann man aus dem Tragen eines
Helmes (klick)
darauf schließen, dass der Patient eher wegen leichterer
Verletzungen behandelt wird, während das Nicht-Tragen (klick) die
Wahrscheinlichkeit schwerer (Kopf-)Verletzungen erhöht. Das
alles liegt aber nur daran, dass Helmträger mit höherer
Wahrscheinlichkeit aus Gruppe A stammen und entsprechend
häufiger schon mit kleineren Wehwehchen nach einem
Fahrradunfall zum Arzt rennen und dadurch deren schwere
Kopfverletzungen in der Masse der weniger schweren
Verletzungen untergehen.
Garkeinen Zusammenhang zwischen Helmtragen und
Verletzungsschwere besteht in diesem Modell, wenn wir nicht
wissen, ob jemand behandelt wurde oder nicht (klick). Man
sieht aber vor allem auch, dass wenn man weiß zu welcher
Gruppe jemand gehört - egal ob Gruppe A (klick), oder
Gruppe B (klick)
das Tragen (klick)
bzw. Nicht-Tragen (klick)
eines Helms keinen Einfluss mehr auf die Häufigkeit schwerer
Kopfverletzungen hat.
Dies ist ein hypothetisches Modell, welches bestimmte
Artefakte der Daten gut erklären kann - es ist jedoch kein
Beweis, dass die echter Erklärung für die Daten genau auf
dieses Phänomen zurückzuführen ist. Dass in den realen Daten
aber etwas nicht stimmen kann erkennt man an der mysteriösen
und (gerne verschwiegenen) scheinbaren "Schutzwirkung" auch
für andere Körperteile.
Ohne das hier allzusehr ausdehnen zu wollen, sei der
Vollständigkeit halber noch dazugesagt, dass andere,
seriösere Untersuchungen belegen, dass evtl. vorhandene
geringe positive Effekte auf Schädelverletzungen durch das
erhöhte Risiko für Nackenverletzungen, das Helme mit sich
bringen (mehr Masse, mehr Hebelwirkung beim Verdrehen des
Kopfes durch den größeren Umfang) wieder zunichte gemacht
werden. Auch sind Fahrradhelme nicht für schwere Unfälle
ausgelegt und sind nicht vergleichbar z.B. mit
Integralhelmen wie sie bei Motarradfahrern üblich sind.
Trotzdem ist das Risiko (auch das für Kopfverletzungen) beim
Fahrradfahren nicht höher als bei anderen
Fortbewegungsarten, wie z.B. dem Autofahren (trotz Airbags,
etc.) oder dem Zu-Fuß-Gehen.