Gefangenen-
Dilemma in Kürze
Das Gefangendilemma ist ein Spiel, das die Wirkung des Nashgleichgewichts
demonstrieren soll. Es ist so konstruiert, dass die Spieler gemeinsam ein
anderes Interesse haben als die Spieler einzeln aus ihrer jeweiligen
Froschperspektive. Man nennt das oft einen Konflikt zwischen kollektiver
und individueller Rationalität.
Die Geschichte zum Gefangenendilemma
Das Gefangenendilemma wurde ursprünglich als rein abstraktes Spiel
konstruiert. Erst später wurde eine Cover story dazu erzählt, von der
man sich heutzutage einig ist, dass sie nicht strategisch äquivalent zu
dem Spiel ist. Dennoch wird sie immer wieder erzählt, und wenn Sie wissen
möchten, woher denn der Name stammt, dann lesen Sie weiter - andernfalls
überspringen Sie diese Stelle lieber zuerst und lesen Sie gleich beim wiederholten
Gefangenendilemma (in dieser Spalte) weiter.
Hier die Cover story
zum Gefangenendilemma:
Zwei Ganoven begehen gemeinsam ein Verbrechen, das ihnen aber nicht
nachgewiesen werden kann. Dennoch werden sie als verdächtig gefasst und
einzeln verhört. Der Gefängnisdirektor stellt folgende Bedingungen auf:
Wenn beide dicht halten, dann wird er sie wegen verbotenen Waffenbesitzes
vor Gericht bringen, was eine kurze Freiheitsstrafe zur Folge hat. Wenn
aber einer allein gesteht, dann wird er zum Kronzeugen und daher
freigelassen, der andere wird jedoch zu fünf Jahren verurteilt. Gestehen
jedoch beide, dann gibt es keinen Kronzeugen, sondern zwei geständige
Verbrecher und beide bekommen vier Jahre Freiheitsstrafe. Wenn in dieser
Geschichte ausschließlich die Freiheitsstrafen als "Auszahlungen"
(mit umgedrehtem Vorzeichen) angesehen werden, dann entspricht die dieses
Gefangenendilemma dem rechts beschriebenen Spiel mit einer dominierten
Strategie für jeden Spieler.
Die strategischen Möglichkeiten ändern sich gewaltig, wenn das Gefangenendilemma
wiederholt zwischen denselben Spielern gespielt wird. Dennoch hängt es
von Kleinigkeiten ab, ob sie zu einer Kooperation finden können oder
nicht.
Es gibt eine ganze Literaturrichtung, die sich mit der Frage der
Entstehung von Kooperation unter Egoisten beschäftigt. Sie geht im
Wesentlichen auf Robert
Axelrod zurück. Auch ich selbst habe 1988 darüber meine erste
eigenständige Arbeit zur Spieltheorie verfasst (die ich demnächst erneut
als E-Book zur Verfügung stellen werde). |
Das Gefangenendilemma mal anders
Das Gefangenendilemma ist vermutlich das bekannteste Spiel, das
die Spieltheorie jemals hervorgebracht hat. Für viele Menschen ist das
Gefangenendilemma das Einzige, das sie mit Spieltheorie verbinden, und
viele denken, das Gefangenendilemma sei geradezu gleichbedeutend mit
Spieltheorie überhaupt.
Ich erspare Ihnen und mir hier einmal die Cover story des
Gefangenendilemmas und schildere Ihnen das Spiel einmal ganz anders als
Sie es sonst gewohnt sein werden (wenn Sie es noch gar nicht kennen - umso
besser, dann lernen Sie gar nicht erst die Fehlinterpretationen, die ich
hier den anderen mühsam wieder abgewöhnen muss). Also:
An einem Schulfest bieten Ihnen die Kinder eine Art Roulette an, bei
dem Sie zwei Gummibärchen auf einen von zwei Hütchen setzen dürfen. Das
eine Hütchen heißt C, das andere heißt D (der Mathematiklehrer
hatte sie eigentlich Chi und Xi nennen wollen, die Schüler waren für A
und B, sodass C und D als Kompromiss herauskam). Danach wird ein
Rouletterad gedreht. Ihr Gewinn hängt jetzt folgendermaßen von den
Farben und Ihrer Wahl ab (die Zahlen sind Auszahlungen in Gummibärchen,
wobei ich davon ausgehe, dass Sie Gummibärchen
mögen und ihnen mehr Bärchen lieber sind als weniger):
Klar, dass Sie es besser fänden, wenn eine rote Zahl fallen würde -
aber darauf haben Sie keinen Einfluss. Ihr Einfluss erstreckt sich nur auf
die Wahl zwischen C und D (in der Spieltheorie nennt man C und D Strategien).
Als regelmäßiger Leser meiner Internetseite und meines Buches
wissen Sie natürlich schon, dass es hier ein einfaches
Rationalitätskriterium gibt, über das sich sogar die Philosophen einig
sind: die dominante
Strategie. Was immer das Roulettrad sagt, mit der Wahl von D schneiden
Sie anschließend besser ab als mit C. Also streichen Sie gedanklich das
Hütchen C und wählen D. Ganz einfach. (Falls Sie das hier nicht glauben,
dann lesen Sie hier zunächst meinen Beitrag über die dominante
Strategie.)
Natürlich reiben Sie sich die Hände ob Ihres Gewinns. Denn während
Sie bei jedem Spiel zwei Gummibärchen einsetzen, gewinnen Sie im
Erwartungswert mit der Strategie D drei Bärchen (nämlich mit 50%
Wahrscheinlichkeit eines und mit 50% fünf, also im Durchschnitt drei). So
ist das hier, wenn Sie gegen die Natur
spielen.
Was machen Sie eigentlich, wenn Sie das Gefühl haben, dass die
Schüler ein wenig schummeln und das Rouletterad nicht richtig fair ist?
Lassen Sie sich nicht verwirren! Eine dominierte Strategie ist eine
dominierte Strategie und damit Ende der Analyse: Es kann niemals rational
sein, sie zu wählen. Denken Sie daran, sogar die Philosophen sind sich
hier einig, und das soll schon etwas heißen. Daher wählen Sie die
Strategie D, völlig egal, wie die Wahrscheinlichkeiten sind, gegen die
Sie spielen. Im schlimmsten Fall bekommen Sie eben die Auszahlung von 1
(wenn das Rouletterad "zufällig" immer schwarz wählt), aber
das ist immer noch besser als eine Auszahlung von 0.
Sie wählen auch noch dann immer D, wenn es gar kein Rouletterad gibt,
sondern die Auszahlung von irgend etwas anderem abhängig ist. Es gibt
niemals einen Grund, es anders zu machen - wie gesagt: dominiert ist
dominiert.
Das gilt auch dann, wenn die Wahl über rot und schwarz von einer
vernunftbegabten Person vorgenommen wird. Selbst dann, wenn sie gar nicht
wissen, was diese Person eigentlich gut oder schlecht findet. Sie brauchen
es nicht zu wissen, denn C bleibt dominiert. Behalten Sie das bitte im
Hinterkopf und lassen Sie sich von dieser Erkenntnis nicht ablenken.
Und jetzt gehen wir auf die andere Seite des Schulfest-Standes. Dort
wird ein ähnliches Spiel gespielt, bei dem die Teilnehmer ebenfalls auf
zwei Hütchen setzen können, nämlich auf ein rotes oder ein schwarzes.
Danach wird eine Münze geworfen, auf deren einer Seite der Buchstabe D
und auf der anderen C steht. Die Auszahlungen für die Spieler sind
hierbei folgende:
Ein alter Hut: Hier können Sie nur entscheiden, ob sie rot oder
schwarz wählen, die Entscheidung über C oder D liegt bei der Münze.
Hier dominiert Ihre Strategie schwarz die Strategie rot und folglich
wählen Sie schwarz.
Das tun Sie auch dann, wenn die Entscheidung über C oder D gar nicht
von einer Münze kommt, sondern von irgend etwas anderem. Auch dann, wenn
dieses Etwas eine andere vernunftbegabte Spielerin ist.
Und jetzt machen die Schüler etwas Raffiniertes: Sie lassen die
Teilnehmer auf der einen Seite des Standes gegen die auf der anderen Seite
spielen. Das heißt, sie schaffen das Rouletterad und die Münze ab und
sagen, dass die Auszahlung auf der einen Seite des Standes von der
Entscheidung auf der anderen Seite abhängt. Also: Auf der einen Seite
wählt ein Spieler C oder D, auf der anderen Seite wählt einer rot oder
schwarz. Dann wird jedem die Wahl des jeweils anderen mitgeteilt, die
Gummibärchen ausgezahlt, und dann geht es in die nächste Runde.
[Kleiner Regeleinschub: Keiner darf an zwei Runden teilnehmen. Und
keiner darf jemals erfahren, wer sein Gegenspieler war. Damit das auch
gewährleistet ist, müssen alle Teilnehmer ihre Entscheidung schriftlich
abgegeben, danach mischen die Schüler alles durch und fassen immer zwei
Teilnehmer zu einem Paar zusammen, das gegeneinander spielt. Anschließend
zahlen sie schön anonym aufgrund einer Codenummer die Gummibärchen aus.
Genau so wurde es in vielen wissenschaftlichen Untersuchungen tatsächlich
gemacht. Ich nehme dafür auch in der Tat sehr oft Gummibärchen, die
meisten anderen Wissenschaftler schwören aber auf echtes Geld. Auch für
dieses Verfahren gab es übrigens schon einen Nobelpreis, nämlich 2002 an
Vernon Smith. Das Ganze nennt sich Experimentelle Wirtschaftsforschung und
ist ein ganzes Kapitel in meinem Spieltheorie-Buch.
Einschub Ende.]
Wie auch immer: Sie stehen auf einer Seite des Standes und fragen sich,
ob Sie C oder D wählen. Einfach: D, weil es C dominiert. Die
Regeländerungen sind dafür völlig egal. Sie stehen auf der anderen
Seite des Standes und fragen sich, ob Sie rot oder schwarz wählen.
Einfach: schwarz, weil es rot dominiert. Regeländerungen wiederum
egal.
Das Spiel sieht jetzt folgendermaßen aus:
|
|
B(erta) |
|
|
|
rot |
schwarz |
| A(anton) |
C |
3, 3 |
0,5 |
|
D |
5,0 |
1,1 |
(Sie wissen nicht, wie man derartige Spiele liest? Oje, Sie brauchen
mein Spieltheorie-Buch.
Aber ich sage es Ihnen hier in Kürze: Jeder Spieler wählt zwischen
seinen Alternativen aus, die Kombination der Entscheidungen führt zu
einem Spielausgang, der durch seine Auszahlungen an die beiden
Spieler gekennzeichnet ist. Diese Auszahlungen stehen in den
entsprechenden Tabellenfeldern, wobei die erste Zahl die Auszahlung an
Anton, die zweite an Berta ist. Wählt Anton z.B. rot und Berta schwarz,
dann bekommt er 0 und sie 5 als Auszahlung.)
Was ist das Resultat des oben beschriebenen Verahaltens in diesem Spiel? Alle wählen D
bzw. schwarz. Das ist Pech, denn
dadurch bekommt jeder Teilnehmer nur eine Auszahlung von 1.
Genau das ist das Dilemma: Eigentlich wären alle besser dran, wenn sie
rot bzw. C wählen würden, denn dann würde jeder mit drei Gummibärchen
nach Hause gehen. Aber aus der individuellen Sicht wäre das nicht
vernünftig, weil C und rot dominierte Strategien sind. Daher ist der allgemeine Name für diese Situation
"soziales Dilemma", auch wenn heutzutage jeder einfach nur
Gefangenendilemma dazu sagt.
Was jetzt kommt, ist eine lange Diskussion, wie man das denn verhindern
kann. Ob man es überhaupt verhindern soll. Ob die Situation irgendwo im
echten Leben so auftritt oder ob das alles nur die Phantasien abstrakter
Mathematiker sind. Was sich ändert, wenn sich die Spieler mehrfach
begegnen können. Welche Rahmenbedingungen man setzen kann oder soll, um
diese Situation zu verhindern. Ob wir angeborene Mechanismen haben, die
dieses Verhalten verhindern. Und so weiter.
Wenn Sie das interessiert, dann lesen Sie zum Einstieg am besten das
Buch von Robert Axelrod "Die
Evolution der Kooperation".
Das Gefangenendilemma und die Spülmaschine
"Warum räumt niemand die Spülmaschine ein? Weil es
ein Gefangenendilemma ist."
Dieser Satz stand auf dem Plakat, mit dem ein Vortrag von mir über das
Gefangenendilemma angekündigt wurde (übrigens vor einem sehr
interessierten Publikum; ein Zuhörer hat mich danach sogar angesprochen,
was er denn studieren müsse, um möglichst viel mit Spieltheorie zu tun
zu haben - ein guter Ansatz).
Sich
das Spülmaschinenproblem anzusehen ist jedenfalls ein schönes
Anwendungsbeispiel, mit dessen Hilfe das Wesen des Gefangenendilemmas (und
auch seine Grenzen) vielleicht etwas deutlicher wird. Dazu führen wir zunächst
einmal zwei Größen ein:
S = der Nutzen, den wir aus dem sauberen Geschirr ziehen.
a = der (negative) Nutzen, den wir durch den Aufwand fürs Einräumen
bekommen; der Aufwand fürs
Ausräumen sei hier inbegriffen.
Damit es von der Darstellung her nicht zu schwierig wird, stellen wir
uns zwei Personen vor, die beide dieselben Nutzenwerte haben und dieses
Spiel miteinander spielen.
Angenommen, beide räumen brav die Spülmaschine gemeinsam ein, dann
ziehen sie daraus einen Nutzen von S-a/2, weil sie den ganzen Nutzen des
sauberen Geschirrs S haben minus des halben Aufwands fürs Aus- und
Einräumen, also a/2. Wenn einer einfach nichts tut, der andere aber
einräumt, dann bekommt der Faulpelz S, der andere bekommt S-a, weil er ja
jetzt den ganzen Aufwand allein hat. Und wenn keiner etwas tut, dann
bekommt keiner das saubere Geschirr, aber es hat auch keiner den Aufwand
a, also im Ergebnis 0. Als Bimatrix-Spiel geschrieben, sieht das dann so
aus:
|
|
Berta |
|
|
|
einräumen |
nichts tun |
| Anton |
einräumen |
S-a/2 , S-a/2 |
S-a , S |
|
nichts tun |
S , S-a |
0 , 0 |
Sie erinnern sich, was ein Gefangenendilemma ist: Beide Spieler
müssen eine dominierte Strategie haben, die ausgerechnet einen solchen
Spielausgang ermöglicht, den beide gemeinsam (aus kollektiver Sicht)
bevorzugen würden. (Ein wenig genauer wäre es, wenn ich das Wort
Effizienz verwenden könnte, aber ich will hier niemanden
verwirren.)
Um zu sehen, ob es sich hier wirklich um ein Gefangenendilemma handelt,
müssen wir prüfen, ob die Strategie mit dem kollektiv erstrebenswerten
Spielausgang dominiert wird. Kollektiv erstrebenswert wäre, dass beide
ihre individuelle Strategie "einräumen" wählen.
Wenn wir "einräumen" mit "nichts tun" vergleichen,
dann ist offensichtlich, dass wenn der andere einräumt, die beste Antwort
darin besteht, es nicht zu tun (denn wir haben ja dann den Nutzen des
sauberen Geschirrs S, ohne irgendwelchen Aufwand). Wenn "nichts tun" auch dann die
beste Antwort ist, wenn der andere nichts tut, dann dominiert "nichts
tun" die Strategie "einräumen" und es handelt es sich um
ein Gefangenendilemma.
Wenn der andere nichts tut, dann bekommen wir entweder S-a oder 0.
Sofern hierin S-a < 0 gilt, bevorzugen wir das Nichtstun. Mit anderen
Worten: Das obige Spiel ist ein Gefangenendilemma, falls S-a < 0, also
falls der Schaden durch das Einräumen der Spülmaschine ohne
Unterstützung des anderen größer ist als
der Nutzen durch das saubere Geschirr. In diesem Fall sagen sich beide:
"Wenn der andere einräumt, ist's gut; wenn nicht, dann lohnt es sich
jedenfalls nicht, dass ich es allein tue". Dummerweise sagen sich das
beide, und daher räumt niemand ein; so ist das beim Gefangenendilemma.
Ich möchte dies mal den Fall "Wohngemeinschaft" nennen.
Über das Gefangenendilemma hinaus
Das
war einfach. Aber was ist jetzt, wenn S-a > 0 gilt? Dann ist es
auf jeden Fall kein Gefangenendilemma mehr. Wenn Sie ein wenig vorgebildet
in Spieltheorie sind, dann können Sie sich schon einmal überlegen, was
in diesem Fall alles passieren kann. Ich werde in Zukunft darüber
berichten.
|
|