Alle Artikel von Rieck

Nash_Bar-Szene

John Nash’s Bar-Szene in „A Beautiful Mind“

Version vom 04.03.16;
Erstversion vom 03.03.16

Das Nash-Gleichgewicht in der Bar-Szene

In dem Film „A Beautiful Mind“ gibt es eine berühmte Szene, in der John Nash mit seinen Kumpels in einer Bar mehreren Studentinnen gegenüberstehen und Nash die optimale Strategie darlegt, wie sich die männlichen Freunde verhalten sollten. Wie kann man diese Situation spieltheoretisch modellieren, und ist das wirklich das Nash-Gleichgewicht, das hier dargestellt wird?

 

John Nash in der Bar

Falls Sie den Film „A Beautiful Mind“ noch nicht gesehen haben, dann sollten Sie das jetzt möglichst schnell nachholen und sich gleich einmal den Film auf DVD bestellen. Als kleinen Einstieg können Sie schon einmal einen Blick auf die berühmte Bar-Szene werfen, in der John Nash und seine Kumpels einer Gruppe Studentinnen gegenüber stehen und offenbar alle die einzige Blonde in der Gruppe ansprechen wollen (der letzte Link führt zu der Szene auf Youtube).

In dem Film soll in dieser Szene die Grundidee des Nash-Gleichgewichts dargestellt werden. Sehen wir uns deshalb an, wie man die Situation als Spiel darstellen kann und suchen dann die Nash-Gleichgwichte.

In der Szene gibt es ziemlich viele Personen, und die machen die Modellierung meist etwas komplizierter, daher reduzieren wir zunächst einmal die Anzahl der Spieler auf nur zwei. Das ist natürlich nicht erfolderlich, macht uns das Leben aber viel einfacher. Die Spieler sind dann erstens John Nash und zweitens einer seiner Kumpels.

Offenbar haben alle Männer die gleichen Präferenzen und finden die Blonde am besten, obwohl ihnen die Brünetten wohl auch gut gefallen. Unsere Spieler bekommen daher eine Auszahlung von 2, wenn sie mit der Blonden ungestört sprechen können, und eine Auszahlung von 1, wenn sie mit einer Brünetten ungestört sprechen können. Wenn sich mehrere Männer auf dieselbe Frau stürzen, dann erhalten die Männer jeweils eine Auszahlung von 0, weil sich dann gegenseitig stören. Das empfinden sie dann genauso schlecht wie wenn sie gleich ihr Bier weitergenuckelt hätten.

Wichtig ist jetzt noch, dass es eine Frau mehr gibt als Männer. Denn nun haben die Männer einen Freiheitsgrad mehr und können eine der Frauen übrig lassen. Das etwas stilisierte Spiel sieht damit so aus:

Kumpel
spricht die Blonde an spricht die Brünette 1 an spricht die Brünette 2 an
John Nash spricht die Blonde an (0; 0) (2; 1) (2; 1)
spricht die Brünette 1 an (1; 2) (0; 0) (1; 1)
spricht die Brünette 2 an (1; 2) (1; 1) (0; 0)

An dieser Stelle ist es hilfreich, wenn man in meinem Spieltheorie-Buch nachgelesen hat, wie man ein Nash-Gleichgewicht ermittelt. Falls Sie zu den bedauernswerten Personen gehören, die das noch nicht getan haben, dann müssen Sie mir an dieser Stelle einfach glauben, dass es hier vier Nash-Gleichgewichte gibt. Das sind die Strategienkombinationen, die oben fett gedruckt sind. Diese Kombinationen bedeuten folgendes: Entweder spricht Nash die Blonde an und sein Kumpel wahlweise eine der beiden Brünetten; oder sein Kumpel geht zur Blonden und Nash sucht sich ein der beiden anderen aus.

Kleines Problem hier: Derjenige, der zur Blonden geht, bekommt eine höhere Auszahlung als der andere. Aber immerhin geht es beiden besser als wenn sie gar keine angesprochen hätten. Es könnte daher ein wenig Streit darüber geben, wer zur Blonden geht, aber wenn die Kumpels eine Einigung erzielt haben, dann sollten sie sich auch daran halten (genau das ist eine der Folgen des Nash-Gleichgewichts).

Nun stellt der John Nash im Film zwei Behauptungen auf:

  1. Die Kumpels sollten die Blonde stehen lassen und jeweils zu einer der Brünetten gehen.
  2. Es führt nicht zum kollektiv optimalen Ergebebnis, wenn jeder nach seinem individuellen Vorteil strebt.

Mein Leser Edvin Hamidic hat mir hierzu folgende Frage geschickt (und mich damit auf die Idee für diesen Beitrag gebracht): „Geh ich richtig in der Annahme, dass es sich bei der Darstellung „des Spiels“ nicht !!  um ein „Nash Gleichgewicht“ in reinen Strategien handelt, wie es vielfach erzählt wird ?“ Diese Frage lässt sich mit unserer Modellierung von eben leicht beantworten:

 

Der Star des Abends bleibt nicht übrig

Behauptung 1 des Film-Nashs ist offenbar falsch; genauer gesagt, es ist kein Nash-Gleichgewicht, wenn die Kumpels die Blonde übrig lassen und nur die Brünetten ansprechen.

Ein Nash-Gleichgewicht ist eine Kombination aus Verhaltensweisen, bei der sich keiner verbessern kann, sofern der andere Spieler bei seinem Verhalten bleibt. Wenn nun beide Kumpels jeweils eine Brünette ansprechen, dann könnte aber einer der beiden die Blonde nehmen und würde sich damit verbessern. Folglich ist es kein Gleichgewicht, was der Film-Nash da behauptet. Im Gleichgewicht würde nicht die Blonde übrig bleiben, sondern eine ihrer Freundinnen.

Recht hat er allerdings mit der Aussage, dass sich nicht alle „eigennützig“ an die Blonde heranmachen sollten; dies ist ebenfalls kein Gleichgewicht. Denn würden es die Kumpels tun, dann könnte ein einzelner von ihnen seine Auszahlung erhöhen, indem er von diesem Verhalten abweicht und zu einer der Brünetten geht. Er bekäme dann 1 statt 0. Das ist auch intuitiv klar. Denn die Kumpels erzeugen eine künstliche Verknappung, wenn alle die Brünetten links liegen lassen.

Screenshot aus der Bar-Szene: Alle machen sich an die Blonde heran.
Screenshot aus der Bar-Szene: Alle machen sich an die Blonde heran.

Schwieriger zu beurteilen ist die zweite Behauptung, weil wir hier nicht eindeutig sagen können, welches Verhalten offenkundig „dem individuellen Vorteil“ dient. Wenn wir uns aber darauf einigen, dass das Ansprechen der Blonden dem unmittelbaren Eigennutz dient, dann hat der Film-Nash hier recht: Da sich die Kumpels dann gegenseitig blockieren, wäre dieses Verhalten nicht im kollektiven Interesse, obwohl es jeder einzelne gern machen möchte.

Das Problem ist hier, dass die erste Strategie (die Blonde ansprechen) nicht unter allen Bedingungen besser ist als eine der beiden anderen Strategien. Es ist daher nicht einfach möglich, diese eine Strategie als die individuell vorteilhafte Strategie anzusehen. Das wäre erst dann der Fall, wenn das Ansprechen der Blonden aus Sicht des einzelnen Kumplels auf jeden Fall mindestens so gut wie die anderen Strategien ist.

Das wäre aber der Fall, wenn das Bei-Spiel etwas anders aufgebaut gewesen wäre als im Film. Angenommen, die Blonde wäre allein gekommen und die einzigen Strategien der beiden Männer wäre somit entweder ansprechen oder Bier trinken. Dann sähe das Spiel so aus:

Kumpel
spricht die Blonde an trinkt weiter Bier
John Nash spricht die Blonde an (0; 0) (2; 0)
trinkt weiter Bier (0; 2) (0; 0)

Hier ist die Strategie „die Blonde ansprechen“ dominant, und es ist daher individuell auf jeden Fall rational, sie zu spielen. Daher werden es auch beide Männer tun, natürlich nur mit dem Erfolg, dass sie beide eine Auszahlung von 0 bekommen. Hier würde auch eine Absprache nichts nützen, weil man ja nichts verliert, wenn man sich nicht daran hält. Aus dieser Überlegung heraus ist übrigens das berühmte Gefangenendilemma entstanden, das der erste Prüfstein für das Nash-Gleichgewicht war – und an dem die zweite Behauptung des Film-Nashs sehr eindrucksvoll gezeigt werden kann: Adam Smith hatte Unrecht. Es gibt Situationen, in denen es nicht zum kollektiven Optimum führt, wenn jeder Einzelne nach seinem individuellen Vorteil strebt.

 

Nein, dies ist kein Gefangenendilemma

Und damit kommen wir zu einer weiteren Frage, die häufig zur Bar-Szene gestellt wird: Ist die Situation ein Gefangenendilemma? Auch hier gibt es eine klare Antwort: Es ist keines. Das Eingangsspiel hat mit dem Gefangenendilemma fast gar nichts zu tun, sondern es ist eine etwas verallgemeinerte Form des Kampfes der Geschlechter (Battle of the Sexes), das Sie wiederum gut kennen würden, wenn Sie mein Spieltheorie-Buch gelesen hätten; der Kampf der Geschlechter ist ein Koordinationsspiel und kein Dilemma.

Auch die modifizierte Variante mit nur einer Frau kommt dem Gefangenendilemma zwar näher, ist aber auch noch keines. Und ich bin froh darüber, dass sich der Drehbuchschreiber etwas anderes ausgedacht hat. Da verzeihe ich auch, dass das im Film genannte Optimalverhalten kein Nash-Gleichgewicht ist. Aber schließlich ist das ja auch die  Szene, in der John Nash seine geniale Idee erst bekommen hat – und da braucht die Theorie ja noch nicht ganz ausgereift zu sein.

 

Wollen Sie mehr über Spieltheorie wissen?

Ok, dann kommen Sie nicht darum herum, nun endlich mein Spieltheorie-Buch zu kaufen.

Und vergessen Sie nicht, mir auf Twitter zu folgen: @ProfRieck.

Und hier einen Kommentar zu hinterlassen…

Käfer_rauch_dreamstime_s_9032122

VW-Abgas-Skandal: Das Auto ist ein rationaler Spieler

Version vom 24.09.15;
Erstversion vom 23.09.15

VW trickst nicht bei den Abgaswerten – sondern baut ein rationales Auto

VW hat eine Software verbaut, die die Abgasminderung nur dann einschaltet, wenn gerade ein Testzyklus läuft. Das ist exakt die Rationallösung zu dem dahinterliegenden Spiel – und wird uns mit Sicherheit noch andere Fälle dieser Art bescheren, nicht nur im Automobilbereich.

Welches Spiel wird hier gespielt? 

Man versteht eine Situation besser, wenn man sie auf ihren Kern reduziert. Im vorliegenden Fall gibt es eine „Inspektorin“, die die Abgaswerte eines Automobilherstellers überprüft (keine Sorge, ich bin kein Genderist, aber meine geradzahligen Spieler sind immer weiblich). Der Automobilhersteller will bei dem Test besonders gut abschneiden und gleichzeitig möglichst wenig dafür ausgeben. Daher optimiert er die Abgaswerte nicht überall, sondern nur an einigen Stellen.

Tun wir aus Vereinfachungsgründen einmal so, als gäbe es nur zwei Stellen, an denen man prüfen bzw. optimieren kann: Stelle A und Stelle B. Das ist keine sehr große Einschränkung, weil das Prinzip auf auf beliebig viele Prüfstellen erweitert werden kann. Das entstehende Spiel sieht dann so aus wie in der folgenden Tabelle. (In der Tabelle stehen immer die Auszahlungen an den Hersteller vorn und an die Prüferin hinten.)

Wenn der Auto-Hersteller dort optimiert, wo er auch geprüft wird, dann erhält er als Auszahlung 1 (also etwas Gutes), weil er die Stelle B an der Prüferin vorbeigeschmuggelt hat. Prüft sie ihn hingengen dort, wo er nicht optimiert hat, dann verliert der Hersteller Geld (symbolisiert durch eine negative Auszahlung von -1), und sie gewinnt eine Beförderung (Auszahlung von 1).

Abgas-Prüferin
Prüft an Stelle A Prüft an Stelle B
Auto-Hersteller optimiert Stelle A (1; 0) (-1; 1)
optimiert Stelle B (-1; 1) (1; 0)

Das ist erst einmal wenig spektakulär, sondern eine Standardsituation in der Spieltheorie: Es ist ein Diskoordinationsspiel, das Sie als regelmäßgier Leser meiner Seite sicherlich auch schon kennen, als ich gefragt habe Wie viele Steuerfahnder braucht das Land? Das dortige Spiel hat prinzipiell die gleiche Struktur, was auch wenig erstaunlich ist, weil dort ein Steuerzahler ein paar Euro am Finanzamt vorbeileiten will, was die Steuerfahnderin aufzudecken versucht. Ähnlich wie hier eben.

 

Das rationale Verhalten in diesem Spiel

Die Rationallösung dieses Spiels ist eigentlich, dass die Prüferin „mischt“, also zufällig mal hier und mal da prüft. Da es den Hersteller überall erwischen kann, macht er es genauso. Wenn die Kosten für das Erwischt-Werden hoch genug sind, dann mischt er nur noch ein klein wenig und macht es fast immer wie gewünscht.

In dem echten Prüfspiel zum Abgastest gibt es aber eine Besonderheit: Die Prüferin sagt vorher, wo sie prüfen wird. Das liegt daran, dass der Testzyklus „justiziabel“ sein muss und vorher in einer Norm genau beschrieben wurde. In dem obigen Spiel bedeutet das, dass die Prüferin schon vorher sagt, ob sie an Stelle A oder B prüfen wird. Nun hat das Diskoordinationsspiel aber einen ausgeprägten Second-Mover-Advantage, d.h. wenn sich ein Spieler vorher festlegt, was er tun wird, dann gibt dies dem anderen Spieler einen deutlichen Vorsprung. Wenn nur an Stelle A geprüft und dies auch noch angekündigt wird, dann optimiert der Hersteller natürlich auch nur die Stelle A.

Genau das hat VW getan. Es wurde angekündigt, wie geprüft wird, und VW optimiert für diese Prüfung. Das ist keineswegs neu. Diese sogenannte „Zyklenerkennung“ ist nicht nur völlig rational, sondern auch weit verbreitet. Sogar in diesem Fall war es durchaus schon vor dem Skandal bekannt. Schon in den 1980er Jahren wurden zum Beispiel Hifi-Verstärker so gebaut, dass sie den Ausgang komplett abschalten, solange kein Signal anliegt. Dann hört man kein Rauschen und es wirkt bei der normgerechten Messung so, als habe der Verstärker einen riesigen Rauschabstand, wie es dort so schön heißt. Natürlich ist das genauso ein Fake wie der Abgastest von VW, denn bei dem Hören echter Musik bricht der Rauschabstand sofort auf den ungefälschten Wert zusammen.

Ist Ihnen schon einmal aufgefallen, dass von der Stiftung Warentest hochgelobte Produkte oftmals im Alltag viel schlechter sind als die vermeintlichen Nieten? Das liegt unter anderem daran, dass besonders die großen Hersteller ziemlich genau wissen, wo die Messpunkte sind (was durchaus etwas übertragend gemeint ist) und einfach dagegen optimieren. Dann schneidet das Produkt im Test hervorragend ab und ist im Alltag trotzdem eine Zitrone. Ich habe zum Beispiel ein Pedelec, das bei der Stiftung Warentest ein „mangelhaft“ bekommen hat – aber im Alltag hält es seit zig Tausend Kilometern besser als alle Konkurrenzprodukte, die ich kenne. Es stammt von einem kleineren Hersteller aus der Schweiz (Biketec), der einfach gute Fahrräder bauen wollte und keine testoptimierten. Er ist nach dem Testurteil fast in die Pleite gerutscht, weil er das Spiel nicht rational gespielt hatte.

 

Wo ist jetzt doch gleich der Skandal?

Wieso sind wir nun auf einmal alle so schockiert von VW? Und wieso hat VW so etwas Verwerfliches getan? Tatsache ist, dass wir dieses Verhalten nicht  nur von etlichen anderen Stellen kennen, sondern es auch meist dulden. Deshalb bin ich auch sicher, dass der Skandal noch ganz andere Ausmaße annehmen wird und sich andere Hersteller (nicht nur von Autos) schon mal sehr warm anziehen können.

Aber dennoch, wieso empfinden wir den Fall von VW als Skandal? Das liegt an den neuen technischen Möglichkeiten und der Intelligenz, die heutzutage in den Fahrzeugen steckt. Bei einem rein mechanischen System (wie einem Fahrrad) kann man nur sehr begrenzt gegen einen bekanntgegebenen Prüfzyklus optimieren. In modernen Autos entsteht aber eine neue Qualität. Das Auto selbst wird so intelligent, dass es wie ein eigener Spieler auftritt. Wir müssen verstehen, dass ein Auto in der Lage ist, selbst rational mitzuspielen und eine Prüferin zu überlisten. Das ist es, was uns so schockiert. VW hat nicht qualitativ anders gehandelt als schon vorher üblich. Aber wo vorher die Komplexität einer Toilettenspülung war, ist nun auf einmal ein rational handelnder Spieler in Form einer künstlichen Intelligenz. Wir müssen verstehen, dass das Auto selbst ein Spieler in dem Spiel ist, das ich oben beschrieben habe. Das Auto ist intelligent und spielt mit.

Diese Erkenntnis wird uns in der nahen Zukunft noch oft beschäftigen, glauben Sie mir.

dreamstime_s_42916968

Ja, aber…

Auf Twitter erreichen mich einige Gegenargumente und Hinweise:

Vorgabe ist ja erstmal nicht: Bestehe den Test am Prüfstand. Sondern: Halte die Gesetze ein.

Interessanterweise ist das nicht so – denn das Gesetz besagt nicht, dass ein Fahrzeug im Alltagsbetrieb bestimmte Abgaswerte erreichen muss, sondern dass es das in einem definierten Testzyklus tun muss. Und das wird ja erfüllt. Daher bin ich auch gespannt, was vor Gericht am Ende konstruiert wird, denn formal wurde überhaupt kein Gesetz gebrochen. Die Software mag nicht im Sinne des Gesetzes gewesen sein, aber zwischen legal und legitim gab es schon immer große Unterschiede.

Und die Prüferin in Vertretung des Staats ist kein Spieler, sondern macht die Regeln, ist quasi Spielleiter

Der „Staat“ hat die Regeln erlassen, nach denen jetzt gehandelt wird; dies sind die Spielregeln, durch die das obige Spiel entsteht. Innhalb dieses Spiels läuft das oben Beschriebene ab. Es war zu keinem Zeitpunkt vorgesehen, dass die Laborwerte mit den Realwerten auf der Straße verglichen werden. Das ist jetzt nur gewissermaßen aus Zufall geschehen (und mit so viel PR-Wirbel, dass VW sich nicht mehr einfach auf die jurstische Position zurückziehen kann, es habe den Test ja formal bestanden).

Dann ist die Börse aber ganz schön irrational, wenn sie rationales Verhalten mit -20% bestraft.

Das ist der sicherlich zutreffende Hinweis darauf, dass es ein umfassenderes Spiel gibt, nämlich das Reputationsspiel einer Marke. Keine Frage, dass in diesem großen Spiel VWs Verhalten ein Fehler war, zumindest rückblickend.

Würfelbeispiel widerspricht Ihrer VW-Argumentation: Das ist kein Spiel, sondern theoriefreier Betrug.

Dieser Kommentar bezieht sich auf diesen Beitrag in Bezug auf die Bombe im Handgepäck. Ich unterschreibe das trotzdem nicht, denn die VW-Vorgehensweise mag zwar Dienst nach Vorschrift sein, aber eben gerade kein Betrug. Übrigens ist auch in dem Würfelbeispiel bei der Bombe meine Aussage, dass wir bei einer Bombe im Flugzug nicht so tun dürfen, als sei das alles komplett zufällig, sondern dass auch dort denkdene Menschen handeln, sowohl auf Seiten der Terroristen als auch der Flughafensicherheit. Die bisherigen Testvorschriften im Automobilbau haben diesen Zusammenhang schlichtweg noch übersehen und vergessen, dass in ein Auto heutzutage echte künstliche Intelligenz eingebaut wird. Die muss man spieltheoretisch behandeln.

Einige andere Leser sehen ein ganz anderes großes Spiel:

Es hat mit Zufall nichts zu tun! Das ist mal ganz klar…

Alle Steuergeräte haben eine ECE Zykluserkennung implementiert, weshalb VW, weshalb in den USA, weshalb jetzt?

d Rache des ‚Pietsch,u d kleine Arschtritt sich nicht zusehr mit Putin wegen Syrien zu einigen!
Diese Gedanken zielen darauf ab, dass jemand die Situation bei VW absichtlich herbeigeführt hat, und zwar aus einem Eigeninteresse heraus. Da man denjenigen nicht kennt, wird die einfache Frage gestellt, wem es nützt. Das ist grundsätzlich sinnvoll, aber der Kreis der Profiteure ist groß. Es ist können die Grünen genauso sein wie Pietsch oder ein unerkannter interner Konkurrent. Ebenso ein Hersteller amerikanischer Diesel-Trucks für den Heimgebrauch. Dass der jetzige Skandal nicht so ganz zufällig hochgepoppt ist, dürfe außer Frage stehen, aber wer und wieso ist aus meiner Sicht derzeit völlig offen.

 

 

Wollen Sie mehr über Spieltheorie wissen?

Es ist üblich, dass ich am Ende meiner Beiträge auf mein Spieltheorie-Buch hinweise. Diesmal möchte ich Sie auch noch auf ein anderes Buch von mir hinweisen, das die Erkenntnis von eben auf die Finanzbranche anwendet: Können Roboter mit Geld umgehen? Hier beschreibe ich, wie weit die Roboter schon sind, um Menschen als Berater abzulösen. Wir werden uns noch umsehen, wie viel mehr die künstlichen Intelligenzen können und welche Auswirkungen das hat.

Und vergessen Sie nicht, mir auf Twitter zu folgen: @ProfRieck.

Und hier einen Kommentar zu hinterlassen…