Version vom 16.10.2007
Erstversion vom 28.09.2006

Gefangenen-
Dilemma in Kürze

Das Gefangendilemma ist ein Spiel, das die Wirkung des Nashgleichgewichts demonstrieren soll. Es ist so konstruiert, dass die Spieler gemeinsam ein anderes Interesse haben als die Spieler einzeln aus ihrer jeweiligen Froschperspektive. Man nennt das oft einen Konflikt zwischen kollektiver und individueller Rationalität.

Die Geschichte zum Gefangenendilemma

Das Gefangenendilemma wurde ursprünglich als rein abstraktes Spiel konstruiert. Erst später wurde eine Cover story dazu erzählt, von der man sich heutzutage einig ist, dass sie nicht strategisch äquivalent zu dem Spiel ist. Dennoch wird sie immer wieder erzählt, und wenn Sie wissen möchten, woher denn der Name stammt, dann lesen Sie weiter – andernfalls überspringen Sie diese Stelle lieber zuerst und lesen Sie gleich beim wiederholten Gefangenendilemma (in dieser Spalte) weiter.

Hier die Cover story zum Gefangenendilemma:

Zwei Ganoven begehen gemeinsam ein Verbrechen, das ihnen aber nicht nachgewiesen werden kann. Dennoch werden sie als verdächtig gefasst und einzeln verhört. Der Gefängnisdirektor stellt folgende Bedingungen auf: Wenn beide dicht halten, dann wird er sie wegen verbotenen Waffenbesitzes vor Gericht bringen, was eine kurze Freiheitsstrafe zur Folge hat. Wenn aber einer allein gesteht, dann wird er zum Kronzeugen und daher freigelassen, der andere wird jedoch zu fünf Jahren verurteilt. Gestehen jedoch beide, dann gibt es keinen Kronzeugen, sondern zwei geständige Verbrecher und beide bekommen vier Jahre Freiheitsstrafe. Wenn in dieser Geschichte ausschließlich die Freiheitsstrafen als „Auszahlungen“ (mit umgedrehtem Vorzeichen) angesehen werden, dann entspricht die dieses Gefangenendilemma dem rechts beschriebenen Spiel mit einer dominierten Strategie für jeden Spieler.

Wiederholtes Gefangenendilemma

Die strategischen Möglichkeiten ändern sich gewaltig, wenn das Gefangenendilemma wiederholt zwischen denselben Spielern gespielt wird. Dennoch hängt es von Kleinigkeiten ab, ob sie zu einer Kooperation finden können oder nicht.

Es gibt eine ganze Literaturrichtung, die sich mit der Frage der Entstehung von Kooperation unter Egoisten beschäftigt. Sie geht im Wesentlichen auf Robert Axelrod zurück. Auch ich selbst habe 1988 darüber meine erste eigenständige Arbeit zur Spieltheorie verfasst (die ich demnächst erneut als E-Book zur Verfügung stellen werde).

 

Das Gefangenendilemma mal anders

Das Gefangenendilemma ist vermutlich das bekannteste Spiel, das die Spieltheorie jemals hervorgebracht hat. Für viele Menschen ist das Gefangenendilemma das Einzige, das sie mit Spieltheorie verbinden, und viele denken, das Gefangenendilemma sei geradezu gleichbedeutend mit Spieltheorie überhaupt.

Ich erspare Ihnen und mir hier einmal die Cover story des Gefangenendilemmas und schildere Ihnen das Spiel einmal ganz anders als Sie es sonst gewohnt sein werden (wenn Sie es noch gar nicht kennen – umso besser, dann lernen Sie gar nicht erst die Fehlinterpretationen, die ich hier den anderen mühsam wieder abgewöhnen muss). Also:

An einem Schulfest bieten Ihnen die Kinder eine Art Roulette an, bei dem Sie zwei Gummibärchen auf einen von zwei Hütchen setzen dürfen. Das eine Hütchen heißt C, das andere heißt D (der Mathematiklehrer hatte sie eigentlich Chi und Xi nennen wollen, die Schüler waren für A und B, sodass C und D als Kompromiss herauskam). Danach wird ein Rouletterad gedreht. Ihr Gewinn hängt jetzt folgendermaßen von den Farben und Ihrer Wahl ab (die Zahlen sind Auszahlungen in Gummibärchen, wobei ich davon ausgehe, dass Sie Gummibärchen mögen und ihnen mehr Bärchen lieber sind als weniger):

Rot Schwarz
C 3 0
D 5 1

Klar, dass Sie es besser fänden, wenn eine rote Zahl fallen würde – aber darauf haben Sie keinen Einfluss. Ihr Einfluss erstreckt sich nur auf die Wahl zwischen C und D (in der Spieltheorie nennt man C und D Strategien). Als regelmäßiger Leser meiner Internetseite und meines Buches wissen Sie natürlich schon, dass es hier ein einfaches Rationalitätskriterium gibt, über das sich sogar die Philosophen einig sind: die dominante Strategie. Was immer das Roulettrad sagt, mit der Wahl von D schneiden Sie anschließend besser ab als mit C. Also streichen Sie gedanklich das Hütchen C und wählen D. Ganz einfach. (Falls Sie das hier nicht glauben, dann lesen Sie hier zunächst meinen Beitrag über die dominante Strategie.)

Natürlich reiben Sie sich die Hände ob Ihres Gewinns. Denn während Sie bei jedem Spiel zwei Gummibärchen einsetzen, gewinnen Sie im Erwartungswert mit der Strategie D drei Bärchen (nämlich mit 50% Wahrscheinlichkeit eines und mit 50% fünf, also im Durchschnitt drei). So ist das hier, wenn Sie gegen die Natur spielen.

Was machen Sie eigentlich, wenn Sie das Gefühl haben, dass die Schüler ein wenig schummeln und das Rouletterad nicht richtig fair ist? Lassen Sie sich nicht verwirren! Eine dominierte Strategie ist eine dominierte Strategie und damit Ende der Analyse: Es kann niemals rational sein, sie zu wählen. Denken Sie daran, sogar die Philosophen sind sich hier einig, und das soll schon etwas heißen. Daher wählen Sie die Strategie D, völlig egal, wie die Wahrscheinlichkeiten sind, gegen die Sie spielen. Im schlimmsten Fall bekommen Sie eben die Auszahlung von 1 (wenn das Rouletterad „zufällig“ immer schwarz wählt), aber das ist immer noch besser als eine Auszahlung von 0.

Sie wählen auch noch dann immer D, wenn es gar kein Rouletterad gibt, sondern die Auszahlung von irgend etwas anderem abhängig ist. Es gibt niemals einen Grund, es anders zu machen – wie gesagt: dominiert ist dominiert.

Das gilt auch dann, wenn die Wahl über rot und schwarz von einer vernunftbegabten Person vorgenommen wird. Selbst dann, wenn sie gar nicht wissen, was diese Person eigentlich gut oder schlecht findet. Sie brauchen es nicht zu wissen, denn C bleibt dominiert. Behalten Sie das bitte im Hinterkopf und lassen Sie sich von dieser Erkenntnis nicht ablenken.

Und jetzt gehen wir auf die andere Seite des Schulfest-Standes. Dort wird ein ähnliches Spiel gespielt, bei dem die Teilnehmer ebenfalls auf zwei Hütchen setzen können, nämlich auf ein rotes oder ein schwarzes. Danach wird eine Münze geworfen, auf deren einer Seite der Buchstabe D und auf der anderen C steht. Die Auszahlungen für die Spieler sind hierbei folgende:

C D
Rot 3 0
Schwarz 5 1

Ein alter Hut: Hier können Sie nur entscheiden, ob sie rot oder schwarz wählen, die Entscheidung über C oder D liegt bei der Münze. Hier dominiert Ihre Strategie schwarz die Strategie rot und folglich wählen Sie schwarz.

Das tun Sie auch dann, wenn die Entscheidung über C oder D gar nicht von einer Münze kommt, sondern von irgend etwas anderem. Auch dann, wenn dieses Etwas eine andere vernunftbegabte Spielerin ist.

Und jetzt machen die Schüler etwas Raffiniertes: Sie lassen die Teilnehmer auf der einen Seite des Standes gegen die auf der anderen Seite spielen. Das heißt, sie schaffen das Rouletterad und die Münze ab und sagen, dass die Auszahlung auf der einen Seite des Standes von der Entscheidung auf der anderen Seite abhängt. Also: Auf der einen Seite wählt ein Spieler C oder D, auf der anderen Seite wählt einer rot oder schwarz. Dann wird jedem die Wahl des jeweils anderen mitgeteilt, die Gummibärchen ausgezahlt, und dann geht es in die nächste Runde.

[Kleiner Regeleinschub: Keiner darf an zwei Runden teilnehmen. Und keiner darf jemals erfahren, wer sein Gegenspieler war. Damit das auch gewährleistet ist, müssen alle Teilnehmer ihre Entscheidung schriftlich abgegeben, danach mischen die Schüler alles durch und fassen immer zwei Teilnehmer zu einem Paar zusammen, das gegeneinander spielt. Anschließend zahlen sie schön anonym aufgrund einer Codenummer die Gummibärchen aus. Genau so wurde es in vielen wissenschaftlichen Untersuchungen tatsächlich gemacht. Ich nehme dafür auch in der Tat sehr oft Gummibärchen, die meisten anderen Wissenschaftler schwören aber auf echtes Geld. Auch für dieses Verfahren gab es übrigens schon einen Nobelpreis, nämlich 2002 an Vernon Smith. Das Ganze nennt sich Experimentelle Wirtschaftsforschung und ist ein ganzes Kapitel in meinem Spieltheorie-Buch. Einschub Ende.]

Wie auch immer: Sie stehen auf einer Seite des Standes und fragen sich, ob Sie C oder D wählen. Einfach: D, weil es C dominiert. Die Regeländerungen sind dafür völlig egal. Sie stehen auf der anderen Seite des Standes und fragen sich, ob Sie rot oder schwarz wählen. Einfach: schwarz, weil es rot dominiert. Regeländerungen wiederum egal.

Das Spiel sieht jetzt folgendermaßen aus:

B(erta)
rot schwarz
A(anton) C 3, 3 0,5
D 5,0 1,1

(Sie wissen nicht, wie man derartige Spiele liest? Oje, Sie brauchen mein Spieltheorie-Buch. Aber ich sage es Ihnen hier in Kürze: Jeder Spieler wählt zwischen seinen Alternativen aus, die Kombination der Entscheidungen führt zu einem Spielausgang, der durch seine Auszahlungen an die beiden  Spieler gekennzeichnet ist. Diese Auszahlungen stehen in den entsprechenden Tabellenfeldern, wobei die erste Zahl die Auszahlung an Anton, die zweite an Berta ist. Wählt Anton z.B. rot und Berta schwarz, dann bekommt er 0 und sie 5 als Auszahlung.)

Was ist das Resultat des oben beschriebenen Verahaltens in diesem Spiel? Alle wählen D bzw. schwarz. Das ist Pech, denn dadurch bekommt jeder Teilnehmer nur eine Auszahlung von 1.

Genau das ist das Dilemma: Eigentlich wären alle besser dran, wenn sie rot bzw. C wählen würden, denn dann würde jeder mit drei Gummibärchen nach Hause gehen. Aber aus der individuellen Sicht wäre das nicht vernünftig, weil C und rot dominierte Strategien sind. Daher ist der allgemeine Name für diese Situation „soziales Dilemma“, auch wenn heutzutage jeder einfach nur Gefangenendilemma dazu sagt.

Was jetzt kommt, ist eine lange Diskussion, wie man das denn verhindern kann. Ob man es überhaupt verhindern soll. Ob die Situation irgendwo im echten Leben so auftritt oder ob das alles nur die Phantasien abstrakter Mathematiker sind. Was sich ändert, wenn sich die Spieler mehrfach begegnen können. Welche Rahmenbedingungen man setzen kann oder soll, um diese Situation zu verhindern. Ob wir angeborene Mechanismen haben, die dieses Verhalten verhindern. Und so weiter.

Wenn Sie das interessiert, dann lesen Sie zum Einstieg am besten das Buch von Robert Axelrod „Die Evolution der Kooperation„.

Das Gefangenendilemma und die Spülmaschine

„Warum räumt niemand die Spülmaschine ein? Weil es ein Gefangenendilemma ist.“

Dieser Satz stand auf dem Plakat, mit dem ein Vortrag von mir über das Gefangenendilemma angekündigt wurde (übrigens vor einem sehr interessierten Publikum; ein Zuhörer hat mich danach sogar angesprochen, was er denn studieren müsse, um möglichst viel mit Spieltheorie zu tun zu haben – ein guter Ansatz).

Sich das Spülmaschinenproblem anzusehen ist jedenfalls ein schönes Anwendungsbeispiel, mit dessen Hilfe das Wesen des Gefangenendilemmas (und auch seine Grenzen) vielleicht etwas deutlicher wird. Dazu führen wir zunächst einmal zwei Größen ein:

S = der Nutzen, den wir aus dem sauberen Geschirr ziehen.
a = der (negative) Nutzen, den wir durch den Aufwand fürs Einräumen bekommen; der Aufwand fürs Ausräumen sei hier inbegriffen.

Damit es von der Darstellung her nicht zu schwierig wird, stellen wir uns zwei Personen vor, die beide dieselben Nutzenwerte haben und dieses Spiel miteinander spielen.

Angenommen, beide räumen brav die Spülmaschine gemeinsam ein, dann ziehen sie daraus einen Nutzen von S-a/2, weil sie den ganzen Nutzen des sauberen Geschirrs S haben minus des halben Aufwands fürs Aus- und Einräumen, also a/2. Wenn einer einfach nichts tut, der andere aber einräumt, dann bekommt der Faulpelz S, der andere bekommt S-a, weil er ja jetzt den ganzen Aufwand allein hat. Und wenn keiner etwas tut, dann bekommt keiner das saubere Geschirr, aber es hat auch keiner den Aufwand a, also im Ergebnis 0. Als Bimatrix-Spiel geschrieben, sieht das dann so aus:

Berta
einräumen nichts tun
Anton einräumen S-a/2 , S-a/2 S-a , S
nichts tun S , S-a 0 , 0

Sie erinnern sich, was ein Gefangenendilemma ist: Beide Spieler müssen eine dominierte Strategie haben, die ausgerechnet einen solchen Spielausgang ermöglicht, den beide gemeinsam (aus kollektiver Sicht) bevorzugen würden. (Ein wenig genauer wäre es, wenn ich das Wort Effizienz verwenden könnte, aber ich will hier niemanden verwirren.)

Um zu sehen, ob es sich hier wirklich um ein Gefangenendilemma handelt, müssen wir prüfen, ob die Strategie mit dem kollektiv erstrebenswerten Spielausgang dominiert wird. Kollektiv erstrebenswert wäre, dass beide ihre individuelle Strategie „einräumen“ wählen.

Wenn wir „einräumen“ mit „nichts tun“ vergleichen, dann ist offensichtlich, dass wenn der andere einräumt, die beste Antwort darin besteht, es nicht zu tun (denn wir haben ja dann den Nutzen des sauberen Geschirrs S, ohne irgendwelchen Aufwand). Wenn „nichts tun“ auch dann die beste Antwort ist, wenn der andere nichts tut, dann dominiert „nichts tun“ die Strategie „einräumen“ und es handelt es sich um ein Gefangenendilemma.

Wenn der andere nichts tut, dann bekommen wir entweder S-a oder 0. Sofern hierin S-a < 0 gilt, bevorzugen wir das Nichtstun. Mit anderen Worten: Das obige Spiel ist ein Gefangenendilemma, falls S-a < 0, also falls der Schaden durch das Einräumen der Spülmaschine ohne Unterstützung des anderen größer ist als der Nutzen durch das saubere Geschirr. In diesem Fall sagen sich beide: „Wenn der andere einräumt, ist’s gut; wenn nicht, dann lohnt es sich jedenfalls nicht, dass ich es allein tue“. Dummerweise sagen sich das beide, und daher räumt niemand ein; so ist das beim Gefangenendilemma. Ich möchte dies mal den Fall „Wohngemeinschaft“ nennen.

 

Über das Gefangenendilemma hinaus

Das war einfach. Aber was ist jetzt, wenn S-a > 0 gilt? Dann ist es auf jeden Fall kein Gefangenendilemma mehr. Wenn Sie ein wenig vorgebildet in Spieltheorie sind, dann können Sie sich schon einmal überlegen, was in diesem Fall alles passieren kann. Ich werde in Zukunft darüber berichten.

Ein Gedanke zu „gefangenendilemma

Schreibe einen Kommentar