Version vom 20.09.2006
Erstversion vom März 2006

Gemischte Strategie

Überblick

Die gemischte Strategie ist ein Arte Lautstärkeregler in der Spieltheorie – wie das funktioniert, erfahren Sie hier. Aber zuvor noch die etwas langweilige Definition für den eiligen Leser: 

Wählt ein Spieler eine gemischte Strategie, dann wählt er keine seiner reinen Strategien direkt aus, sondern er wählt statt dessen einen Zufallsmechanismus aus, der anschließend eine reine Strategie wählt. Formal ist eine gemischte Strategie also eine Wahrscheinlichkeitsverteilung über die reinen Strategien eines Spielers, bei der mindestens zwei Strategien mit positiver Wahrscheinlichkeit ausgewählt werden. Falls Sie das zu mathematisch finden, dann habe ich für Sie hier noch die Version zum Abgewöhnen.

Dann vielleicht doch lieber ein etwas anschaulicheres Beispiel: Ein Spieler hat die beiden Strategien A und B zur Auswahl. Entscheidet er sich nun dafür, A zu wählen, dann wählt er einereine Strategie (eben die reine Strategie A). Wenn er statt dessen ankündigt, dass er zunächst würfelt und nur dann die reine Strategie A wählt, wenn er eine sechs gewürfelt hat, dann spielt er eine gemischte Strategie. Denn statt einer reinen Strategie hat er nun einen Zufallsmechanismus gewählt, der an seiner Stelle die reine Strategie auswählt. Die gemischte Strategie besteht jetzt darin, dass er A mit einer Wahrscheinlichkeit von 1/6 wählt und B mit einer Wahrscheinlichkeit von 5/6 (also der Gegenwahrscheinlichkeit zu 1/6, weil bei allen anderen Würfen von eins bis fünf die Strategie B gewählt wird).

Wozu braucht man gemischte Strategien?

Wenn man keine gemischten Strategien hätte, dann hätte nicht jedes Spiel ein Nash-Gleichgewicht und weder John Nash noch all die anderen Spieltheoretiker hätten ihre Nobelpreise bekommen, weil das ganze Konzept dann in zu vielen Fällen keine Antworten hätte geben können.

Ein einfaches Beispiel für ein Spiel ohne Nash-Gleichgewicht ist Knobeln (oft auch Schnick-Schnack-Schnuck oder Papier, Stein, Schere genannt). Es ist offensichtlich, dass es hier nicht optimal sein kann, immer dieselbe der drei reinen Strategien zu wählen, sondern dass man zwischen den reinen Strategien Papier, Stein und Schere in möglichst unberechenbarer Weise mischen muss. „Möglichst unberechenbar“ ist aber gleichbedeutend mit „zufällig“, und schon haben wir einen Fall, in dem sich gemischte Strategien ganz intuitiv ergeben.

Die Idee hinter den gemischten Strategien besteht darin, dass man die Wirkung reiner Strategien wie an einem Lautstärkeregler regulieren möchte. Nehmen wir dafür ein Beispiel aus dem Kalten Krieg (vielleicht sollte ich dazusagen, dass die ersten bedeutenden Anwendungen und umfangreicheren Forschungen der Spieltheorie im militärischen Bereich waren):

Eine Atommacht hat alle konventionellen Waffen abgeschafft und besitzt nur noch eine gigantische Atombombe, die den Feind völlig vernichtet, wenn sie einmal ausgelöst wurde. Allerdings ist die Verwendung nicht ganz unbedenklich, weil die Bombe auch zahlreiche Kollateralschäden verursacht. Was macht die Atommacht nun, wenn sie provoziert wird? Sie kann jeweils die Atombombe auslösen (Strategie A) oder nichts tun (Strategie B). Das Problem ist nur, dass bei fast jeder Provokation die Atombombe eine klare Überreaktion wäre, aber die Alternative nichts zu tun auch nicht immer eine überzeugende Verhaltensweise ist. Die Atommacht wird sich also wünschen, die Wirkung ihrer Strategie A dosieren zu können – genau das ist aber aufgrund der Natur der Bombe nicht möglich.

Die Lösung ist hier eine gemischte Strategie. Anstatt die Bombe tatsächlich auszulösen, könnte das Militär einen Mechanismus einbauen, der die Bombe lediglich mit einer vorgegebenen Wahrscheinlichkeit auslöst. Wenn man diesen Auslösemechanismus nun noch mit einem Regler ausstattet, dann hat man exakt den Fall einer gemischten Strategie. Fährt nun ein gegnerisches Kriegsschiff in die eigenen Hoheitsgewässer, dann kann man den Regler ein wenig hochdrehen; kommt eine ganze Flotte, dann dreht man den Regler entsprechend weiter. Auf diese Weise kann man exakt dosiert auf den Grad der Provokation reagieren. Erst hierdurch wird es möglich, tatsächlich angemessen auf das Verhalten des Gegners zu reagieren, und das heißt: erst hierdurch entsteht die Möglichkeit für ein Nash-Gleichgewicht.

Natürlich zeigt das Beispiel auch einige Problempunkte der gemischten Strategien: Kann man eigentlich rein technisch einen Mechanismus bauen, der tatsächlich völlig auf sich allein gestellt einen Atomangriff auslöst? Oder gibt es nicht immer irgend eine Möglichkeit, ihn letztlich doch wieder zu deaktivieren? Diese Frage ist in diesem Beispiel wichtig, weil die Atommacht ja fast nie wirklich will, dass die Bombe ausgelöst wird. In anderen Fällen ist dies kein Problem, weil der mischende Spieler oft einen Anreiz hat, sich tatsächlich den Vorgaben seines Zufallsmechanismus entsprechend zu verhalten. Dies ist z.B. beim Knobeln der Fall.

Und einmal angenommen, der Zufallsauslöser sei technisch realisierbar, würde die eigene Bevölkerung eine solche Teufelsmaschine akzeptieren? In der Tat empfinden viele Menschen den Ratschlag als gradewegs absurd, wichtige Entscheidungen des Lebens einem Zufallsprozess zu überlassen, selbst dann, wenn es ganz offensichtlich die beste Verhaltensweise ist.

Aber selbst wenn all dies gelöst wäre, wie würde man dann eigentlich den Zufallsprozess selbst realisieren? Die Zufallszahlengeneratoren in Computern sind in aller Regle nur Pseudozufallsgeneratoren, will heißen, in Wahrheit steckt ein deterministischer Prozess dahinter, der potenziell vorhersagbar ist. Man stände dann vor ähnlichen Problemen wie in der Verschlüsselungstechnik, in der auch immer wieder „echte“ Zufallszahlen benötigt werden. Allerdings ist dieses Problem sicherlich noch das kleinste der genannten, denn man kann physikalische Prozesse verwenden, die hinreichend „zufällig“ sind. Einfachstes Beispiel sind Rouletteräder. Was man aber auf keinen Fall verwenden sollte, sind scheinbare Zufälligkeiten, die man sich selbst ausgedacht hat. Denn Menschen sind außerordentlich schlecht darin, Entscheidungen zufällig zu treffen, denn sie produzieren meist recht leicht vorhersagbare Abweichungen von tatsächlich zufälligen Entscheidungen.

Man sieht: Gemischte Strategien sind für die gesamte Spieltheorie sehr wichtig, aber sie sind philosophisch nicht unproblematisch. Zum Glück gibt es eine ganze Reihe anderer Interpretationen der gemischten Strategie als die hier beschriebene Brachialinterpretation. Diese Erörterungen findet man unter dem Begriff Purification – was ein schönes Thema für einen zukünftigen Beitrag von mir ist. Bis dahin könnten Sie es auch schon einmal in meinem Spieltheorie-Buch nachlesen.

Einen interessanten Anwendungsfall der gemischten Strategie finden Sie übrigens in dem chinesischen Strategem „Im Osten Lärmen, im Westen angreifen“, das ich hier in einem YouTube-Video beschreibe.

 

Häufige Fragen zur gemischten Strategie

Ist eine gemischte Strategie nicht einfach nur die „Umwelt“ der klassischen Entscheidungstheorie?

In der klassischen Entscheidungstheorie spielt man nicht gegen eine vernunftbegabte Gegenspielerin, sondern gegen die Natur, deren Verhalten durch eine Wahrscheinlichkeitsverteilung dargestellt wird. Wenn eine vernunftbegabte Gegenspielerin nun aber eine gemischte Strategie spielt, dann wählt sie ja auch eine Wahrscheinlichkeitsverteilung, gegen die wir anschließend spielen. Wo ist denn nun der Unterschied? Oder kommen wir nach langen Überlegungen über die Vernunftbegabung von Spielern wieder genau dort an, wo wir in der klassischen Entscheidungstheorie schon waren?

Man merkt den Unterschied zwischen den beiden Situationen sofort, wenn man sich klarmacht, wo die Wahrscheinlichkeitsverteilungen herkommen: In der klassischen Entscheidungstheorie wird die Verteilung von einem externen Mechanismus ausgewählt, der keinerlei eigene Interessen verfolgt. Klassischerweise ist das das Wetter, woher auch wohl der Begriff „Spiel gegen die Natur“ kommt. Eine gemischte Strategie wird aber von einer vernunftbegabten Gegenspielerin gewählt. Und diese wird die Wahrscheinlichkeitsverteilung so wählen, dass es aus ihrer Sicht optimal ist. Während in der klassischen Entscheidungstheorie die Wahrscheinlichkeitsverteilung über die Umweltzustände exogen vorgegeben und unveränderlich ist, wird eine gemischte Strategie aufgrund der Überlegungen und Präferenzen einer vernunftbegabten Gegenspielerin ausgewählt, die eigene Interessen verfolgt. Und das ist ein gewaltiger Unterschied.

Aber wieso gibt es dann ganze Abhandlungen darüber, wie man sich in derartigen Situationen optimal verhält?

Über Schnick-Schnack-Schnuck gibt es ganze Webseiten, die dem geneigten Leser erklären, welches die optimale Strategie ist. Ich behaupte mal, das ist zu 50% Psychologie und zu 50% Unwissenheit (die natürlich nur daraus entsteht, dass die Seitenbetreiber mein Spieltheorie-Buch nicht gelesen haben).

Und wie rechnet man eine gemischte Strategie aus?

Diese Frage basiert vermutlich auf einem Missverständnis: Eine gemischte Strategie braucht man nicht auszurechnen, sondern man gibt sie an, indem man die Wahrscheinlichkeitsverteilung über die reinen Strategien benennt (natürlich so, dass die Wahrscheinlichkeiten sich zu eins ergänzen). Vermutlich zielt die Frage darauf ab, wie man ein Nash-Gleichgewicht in gemischten Strategien berechnet. Das ist damit aber eine Frage, die ich bei Gelegenheit einmal im Zusammenhang mit dem Nash-Gleichgewicht beantworten werde. Und Sie werden es schon ahnen: In meinem Spieltheorie-Buch steht auch, wie es geht.

Schreibe einen Kommentar