Kategorie-Archiv: Spieltheorie_Anwendungen

Kipppunkte in der Spieltheorie und in der Klimaforschung

Kipppunkte

Christian Rieck

Version vom 24.08.19;
Erstversion vom 24.08.19

Klimaforscher lieben Alarmismus und haben einen neuen Pfeil im Köcher: die Kipppunkte. Dies sind Punkte, an denen sich das Klima plötzlich ganz anders verhält als zuvor. Interessanterweise gibt es diese Kippunkte auch in den Wirtschaftswissenschaften und spielen dort eine wichtige Rolle. Deshalb kommt hier eine kurze Erklärung, was diese Kipppunkte genau sind und ob sie Grund zur Sorge sind.

 

Wir sind es gewohnt, dass sich Systeme im Gleichgewicht befinden. So sehr, dass wir ein Gleichgewicht meist gar nicht mehr als solches wahrnehmen. Das liegt einfach daran, dass jedes Nicht-Gleichgewicht versucht, so schnell wie möglich in ein Gleichgewicht überzugehen. Deshalb wirkt die Welt um uns herum sehr geordnet und stabil.

Die Erde rast nicht chaotisch auf die Sonne zu und dann wieder von ihr weg, Finanzmärkte schwanken nicht täglich um Zehnerpotenzen und das Wetter wechselt nicht täglich von Frost auf Bruthitze. Bei den meisten Dingen, die uns umgeben, können wir uns sogar darauf verlassen, dass kleine Störungen von dem betroffenen System abgefedert werden. Wenn wir versehentlich gegen einen Stuhl stoßen, dann fällt er meistens nicht gleich um, sondern wackelt nur ein wenig, um dann etwas verrutscht wieder in einem wundervollen Gleichgewicht stehen zu bleiben.

Sehr oft gibt es neben dem altbekannten Gleichgewicht aber noch ein anderes. Wie wir alle wissen, kann der Stuhl tatsächlich umfallen, wenn wir ihn zu stark anstoßen. Er ist dann kurz in einem Ungleichgewichtszustand, aber sobald er liegt, befindet er sich wieder in einem Gleichgewicht, allerdings einem anderen als zuvor.

Dieses zweite Gleichgewicht ist eines, an das wir normalerweise nicht denken, und wenn wir es doch tun, es lieber vermeiden würden. Es ist der umgefallene Stuhl, die zusammengebrochene Währung oder die Finanzmarktkrise.

Interessant ist nun die Phase zwischen den beiden Gleichgewichten. Dort liegt der Bereich der Ungleichgewichte, die von ihrer Natur her immer vorübergehende Zustände sind. Denn ein Ungleichgewicht ist definiert als ein Zustand, der sich aus sich selbst heraus zerstört. Ein System im Ungleichgewicht ist immer bestrebt, wieder in ein Gleichgewicht zu gelangen. Jedes der möglichen Gleichgewichte hat dabei einen Stabilitätsbereich, also einen, innerhalb dessen das System zu dem einen oder anderen hinwandern wird.

Bleiben wir beim kippelnden Stuhl. Wenn wir ihn nur schwach anstoßen, kippt er zwar zunächst, überlegt es sich dann aber anders und fällt wieder in die Ausgangslage zurück. Überschreitet man aber einen bestimmten Punkt im Ungleichgewichtsbereich, dann gibt es kein Zurück mehr: Der Stuhl fällt um und landet in seinem zweiten Gleichgewicht, dem liegenden.

Dieser Punkt, den man nicht überschreiten darf, ist der Kipppunkt. Es heißt deshalb so, weil genau dort das System kippt und nicht mehr – wie sonst gewohnt – in sein altes Gleichgewicht zurückfindet. Dieses Verhalten des Systems ist nicht nur ungewohnt, sondern meist auch irgendwo zwischen befremdlich und tödlich. Denn wo sich die Welt vorher sehr gutmütig und berechenbar verhalten hat, springt sie nun auf einmal in ein ganz anderes, ungewohntes Verhalten. Innerhalb des Stabilitätsbereichs eines Gleichgewichts erscheint alles schön linear und stabil – nach Überschreiten des Kipppunktes ist nichts mehr, wie es einmal war. Der Kipppunkt markiert eine Grenze, ab der sich das altbekannte System schlagartig qualitativ anders verhält als vorher.

<Wenn Sie chinesische Weisheiten mögen: Das chinesische Strategem 01 heißt „Täusche den Kaiser, um das Meer  zu überqueren“ und basiert auf diesen Kipppunkten. Sehen Sie hier mein Video zu dem Kipppunkt-Strategem.>

Es wird den Wirtschaftswissenschaftlern oft vorgeworfen, dass sie die Finanzkrise nicht vorhergesagt hätten. Das stimmt so aber nicht. Sondern diese Art von Krise ist ein zweites Gleichgewicht in einem System, das sich normalerweise in einem gewohnten Gleichgewicht befindet. Es war in der Wirtschaftstheorie durchaus bekannt, dass es dieses Krisengleichgewicht gibt – nur kann man nicht vorhersagen, wann das System in eben dieses kippt.

In der gleichen Situation befindet sich zur Zeit die Klimaforschung, denn auch beim Klima gibt es Kipppunkte. Einmal angenommen, es würde aus irgendwelchen Gründen ein Großteil der Erdoberfläche zugeschneit und in dem folgenden Sommer nicht wegtauen (zum Beispiel, weil ein riesiger Vulkan ausbricht und die Sonneneinstrahlung für einige Monate stark abgemindert wird). Dann könnte es gut passieren, dass selbst nach dem Wegfall der Vulkanasche die weiße Schneeoberfläche so viel der Sonneneinstrahlung reflektiert, dass sie sich nicht richtig erwärmt, sodass auch im zweiten Sommer die Schneefläche bestehen bleibt – und so weiter. Das Klima könnte dadurch in eine Eiszeit kippen.

Es geht auch anders herum. Ein höherer CO2-Gehalt in der Atmosphäre könnte zu einer Erwärmung führen, die ihrerseits noch mehr CO2 freisetzt usw. Solange, bis das Klima ein völlig anderes ist als zuvor. Wie beim kippenden Stuhl kann es passieren, dass sich das System nicht mehr wie gewohnt selbst korrigiert und ins alte Gleichgewicht zurückfindet, sondern dass es bei einer vermeintlich minimalen Änderung der Bedingungen ein ganz anderes Verhalten annimmt. Dass es einen solchen Punkt gibt, ist in der Klimaforschung ebenso bekannt wie die Möglichkeit der Finanzkrise in den Wirtschaftswissenschaften. Nicht bekannt ist aber, wo genau dieser Kipppunkt liegt.

Es ist mir bewusst, dass die Klimaforscher wenig getan haben, um uns Vertrauen in ihre Forschung zu vermitteln. Das liegt zu gewissem Grad dran, dass sie das gegenteilige Problem der Wirtschaftswissenschaftler haben: Während es in der Wirtschaft verpönt war, von der möglichen Krise jenseits des Kipppunktes zu sprechen, so ist es in der Klimaforschung geradezu ein Muss, ständig von ihr zu sprechen. Ich bin kein Klimaforscher und halte mich aus der Diskussion um die genaue Lage des Kipppunktes lieber heraus. Vielleicht sind wir so nah daran, dass wir ihn schon in wenigen Jahren erreichen, vielleicht sind wir aber auch so weit weg, dass wir ihn nie erreichen, weil die Freisetzung von CO2 schon lange vorher aus der Mode kommt und wir alle Energie aus Fusionskraftwerken oder hocheffizienten Solarkollektoren beziehen.

Aber es ist mir wichtig zu vermitteln, dass die Kipppunkte kein neuer Marketinggag einer Klimareligion sind, sondern ein völlig realer Sachverhalt. Ihre Existenz ist auch der Grund dafür, dass viele der modellorientierten Klimaforscher tatsächlich subjektiv außerordentlich besorgt sind – denn auch sie wissen nicht, wie nah wir am Kipppunkt sind. Was eine gute oder eine schlechte Nachricht sein kann.

 

Wollen Sie mehr über Spieltheorie wissen?

Ok, dann kommen Sie nicht darum herum, nun endlich mein Spieltheorie-Buch zu kaufen.

Und vergessen Sie nicht, mir auf Twitter zu folgen: @ProfRieck.

VW-Abgas-Skandal: Das Auto ist ein rationaler Spieler

Version vom 24.09.15;
Erstversion vom 23.09.15

VW trickst nicht bei den Abgaswerten – sondern baut ein rationales Auto

VW hat eine Software verbaut, die die Abgasminderung nur dann einschaltet, wenn gerade ein Testzyklus läuft. Das ist exakt die Rationallösung zu dem dahinterliegenden Spiel – und wird uns mit Sicherheit noch andere Fälle dieser Art bescheren, nicht nur im Automobilbereich.

Welches Spiel wird hier gespielt? 

Man versteht eine Situation besser, wenn man sie auf ihren Kern reduziert. Im vorliegenden Fall gibt es eine „Inspektorin“, die die Abgaswerte eines Automobilherstellers überprüft (keine Sorge, ich bin kein Genderist, aber meine geradzahligen Spieler sind immer weiblich). Der Automobilhersteller will bei dem Test besonders gut abschneiden und gleichzeitig möglichst wenig dafür ausgeben. Daher optimiert er die Abgaswerte nicht überall, sondern nur an einigen Stellen.

Tun wir aus Vereinfachungsgründen einmal so, als gäbe es nur zwei Stellen, an denen man prüfen bzw. optimieren kann: Stelle A und Stelle B. Das ist keine sehr große Einschränkung, weil das Prinzip auf auf beliebig viele Prüfstellen erweitert werden kann. Das entstehende Spiel sieht dann so aus wie in der folgenden Tabelle. (In der Tabelle stehen immer die Auszahlungen an den Hersteller vorn und an die Prüferin hinten.)

Wenn der Auto-Hersteller dort optimiert, wo er auch geprüft wird, dann erhält er als Auszahlung 1 (also etwas Gutes), weil er die Stelle B an der Prüferin vorbeigeschmuggelt hat. Prüft sie ihn hingengen dort, wo er nicht optimiert hat, dann verliert der Hersteller Geld (symbolisiert durch eine negative Auszahlung von -1), und sie gewinnt eine Beförderung (Auszahlung von 1).

Abgas-Prüferin
Prüft an Stelle A Prüft an Stelle B
Auto-Hersteller optimiert Stelle A (1; 0) (-1; 1)
optimiert Stelle B (-1; 1) (1; 0)

Das ist erst einmal wenig spektakulär, sondern eine Standardsituation in der Spieltheorie: Es ist ein Diskoordinationsspiel, das Sie als regelmäßgier Leser meiner Seite sicherlich auch schon kennen, als ich gefragt habe Wie viele Steuerfahnder braucht das Land? Das dortige Spiel hat prinzipiell die gleiche Struktur, was auch wenig erstaunlich ist, weil dort ein Steuerzahler ein paar Euro am Finanzamt vorbeileiten will, was die Steuerfahnderin aufzudecken versucht. Ähnlich wie hier eben.

 

Das rationale Verhalten in diesem Spiel

Die Rationallösung dieses Spiels ist eigentlich, dass die Prüferin „mischt“, also zufällig mal hier und mal da prüft. Da es den Hersteller überall erwischen kann, macht er es genauso. Wenn die Kosten für das Erwischt-Werden hoch genug sind, dann mischt er nur noch ein klein wenig und macht es fast immer wie gewünscht.

In dem echten Prüfspiel zum Abgastest gibt es aber eine Besonderheit: Die Prüferin sagt vorher, wo sie prüfen wird. Das liegt daran, dass der Testzyklus „justiziabel“ sein muss und vorher in einer Norm genau beschrieben wurde. In dem obigen Spiel bedeutet das, dass die Prüferin schon vorher sagt, ob sie an Stelle A oder B prüfen wird. Nun hat das Diskoordinationsspiel aber einen ausgeprägten Second-Mover-Advantage, d.h. wenn sich ein Spieler vorher festlegt, was er tun wird, dann gibt dies dem anderen Spieler einen deutlichen Vorsprung. Wenn nur an Stelle A geprüft und dies auch noch angekündigt wird, dann optimiert der Hersteller natürlich auch nur die Stelle A.

Genau das hat VW getan. Es wurde angekündigt, wie geprüft wird, und VW optimiert für diese Prüfung. Das ist keineswegs neu. Diese sogenannte „Zyklenerkennung“ ist nicht nur völlig rational, sondern auch weit verbreitet. Sogar in diesem Fall war es durchaus schon vor dem Skandal bekannt. Schon in den 1980er Jahren wurden zum Beispiel Hifi-Verstärker so gebaut, dass sie den Ausgang komplett abschalten, solange kein Signal anliegt. Dann hört man kein Rauschen und es wirkt bei der normgerechten Messung so, als habe der Verstärker einen riesigen Rauschabstand, wie es dort so schön heißt. Natürlich ist das genauso ein Fake wie der Abgastest von VW, denn bei dem Hören echter Musik bricht der Rauschabstand sofort auf den ungefälschten Wert zusammen.

Ist Ihnen schon einmal aufgefallen, dass von der Stiftung Warentest hochgelobte Produkte oftmals im Alltag viel schlechter sind als die vermeintlichen Nieten? Das liegt unter anderem daran, dass besonders die großen Hersteller ziemlich genau wissen, wo die Messpunkte sind (was durchaus etwas übertragend gemeint ist) und einfach dagegen optimieren. Dann schneidet das Produkt im Test hervorragend ab und ist im Alltag trotzdem eine Zitrone. Ich habe zum Beispiel ein Pedelec, das bei der Stiftung Warentest ein „mangelhaft“ bekommen hat – aber im Alltag hält es seit zig Tausend Kilometern besser als alle Konkurrenzprodukte, die ich kenne. Es stammt von einem kleineren Hersteller aus der Schweiz (Biketec), der einfach gute Fahrräder bauen wollte und keine testoptimierten. Er ist nach dem Testurteil fast in die Pleite gerutscht, weil er das Spiel nicht rational gespielt hatte.

 

Wo ist jetzt doch gleich der Skandal?

Wieso sind wir nun auf einmal alle so schockiert von VW? Und wieso hat VW so etwas Verwerfliches getan? Tatsache ist, dass wir dieses Verhalten nicht  nur von etlichen anderen Stellen kennen, sondern es auch meist dulden. Deshalb bin ich auch sicher, dass der Skandal noch ganz andere Ausmaße annehmen wird und sich andere Hersteller (nicht nur von Autos) schon mal sehr warm anziehen können.

Aber dennoch, wieso empfinden wir den Fall von VW als Skandal? Das liegt an den neuen technischen Möglichkeiten und der Intelligenz, die heutzutage in den Fahrzeugen steckt. Bei einem rein mechanischen System (wie einem Fahrrad) kann man nur sehr begrenzt gegen einen bekanntgegebenen Prüfzyklus optimieren. In modernen Autos entsteht aber eine neue Qualität. Das Auto selbst wird so intelligent, dass es wie ein eigener Spieler auftritt. Wir müssen verstehen, dass ein Auto in der Lage ist, selbst rational mitzuspielen und eine Prüferin zu überlisten. Das ist es, was uns so schockiert. VW hat nicht qualitativ anders gehandelt als schon vorher üblich. Aber wo vorher die Komplexität einer Toilettenspülung war, ist nun auf einmal ein rational handelnder Spieler in Form einer künstlichen Intelligenz. Wir müssen verstehen, dass das Auto selbst ein Spieler in dem Spiel ist, das ich oben beschrieben habe. Das Auto ist intelligent und spielt mit.

Diese Erkenntnis wird uns in der nahen Zukunft noch oft beschäftigen, glauben Sie mir.

dreamstime_s_42916968

Ja, aber…

Auf Twitter erreichen mich einige Gegenargumente und Hinweise:

Vorgabe ist ja erstmal nicht: Bestehe den Test am Prüfstand. Sondern: Halte die Gesetze ein.

Interessanterweise ist das nicht so – denn das Gesetz besagt nicht, dass ein Fahrzeug im Alltagsbetrieb bestimmte Abgaswerte erreichen muss, sondern dass es das in einem definierten Testzyklus tun muss. Und das wird ja erfüllt. Daher bin ich auch gespannt, was vor Gericht am Ende konstruiert wird, denn formal wurde überhaupt kein Gesetz gebrochen. Die Software mag nicht im Sinne des Gesetzes gewesen sein, aber zwischen legal und legitim gab es schon immer große Unterschiede.

Und die Prüferin in Vertretung des Staats ist kein Spieler, sondern macht die Regeln, ist quasi Spielleiter

Der „Staat“ hat die Regeln erlassen, nach denen jetzt gehandelt wird; dies sind die Spielregeln, durch die das obige Spiel entsteht. Innhalb dieses Spiels läuft das oben Beschriebene ab. Es war zu keinem Zeitpunkt vorgesehen, dass die Laborwerte mit den Realwerten auf der Straße verglichen werden. Das ist jetzt nur gewissermaßen aus Zufall geschehen (und mit so viel PR-Wirbel, dass VW sich nicht mehr einfach auf die jurstische Position zurückziehen kann, es habe den Test ja formal bestanden).

Dann ist die Börse aber ganz schön irrational, wenn sie rationales Verhalten mit -20% bestraft.

Das ist der sicherlich zutreffende Hinweis darauf, dass es ein umfassenderes Spiel gibt, nämlich das Reputationsspiel einer Marke. Keine Frage, dass in diesem großen Spiel VWs Verhalten ein Fehler war, zumindest rückblickend.

Würfelbeispiel widerspricht Ihrer VW-Argumentation: Das ist kein Spiel, sondern theoriefreier Betrug.

Dieser Kommentar bezieht sich auf diesen Beitrag in Bezug auf die Bombe im Handgepäck. Ich unterschreibe das trotzdem nicht, denn die VW-Vorgehensweise mag zwar Dienst nach Vorschrift sein, aber eben gerade kein Betrug. Übrigens ist auch in dem Würfelbeispiel bei der Bombe meine Aussage, dass wir bei einer Bombe im Flugzug nicht so tun dürfen, als sei das alles komplett zufällig, sondern dass auch dort denkdene Menschen handeln, sowohl auf Seiten der Terroristen als auch der Flughafensicherheit. Die bisherigen Testvorschriften im Automobilbau haben diesen Zusammenhang schlichtweg noch übersehen und vergessen, dass in ein Auto heutzutage echte künstliche Intelligenz eingebaut wird. Die muss man spieltheoretisch behandeln.

Einige andere Leser sehen ein ganz anderes großes Spiel:

Es hat mit Zufall nichts zu tun! Das ist mal ganz klar…

Alle Steuergeräte haben eine ECE Zykluserkennung implementiert, weshalb VW, weshalb in den USA, weshalb jetzt?

d Rache des ‚Pietsch,u d kleine Arschtritt sich nicht zusehr mit Putin wegen Syrien zu einigen!
Diese Gedanken zielen darauf ab, dass jemand die Situation bei VW absichtlich herbeigeführt hat, und zwar aus einem Eigeninteresse heraus. Da man denjenigen nicht kennt, wird die einfache Frage gestellt, wem es nützt. Das ist grundsätzlich sinnvoll, aber der Kreis der Profiteure ist groß. Es ist können die Grünen genauso sein wie Pietsch oder ein unerkannter interner Konkurrent. Ebenso ein Hersteller amerikanischer Diesel-Trucks für den Heimgebrauch. Dass der jetzige Skandal nicht so ganz zufällig hochgepoppt ist, dürfe außer Frage stehen, aber wer und wieso ist aus meiner Sicht derzeit völlig offen.

 

 

Wollen Sie mehr über Spieltheorie wissen?

Es ist üblich, dass ich am Ende meiner Beiträge auf mein Spieltheorie-Buch hinweise. Diesmal möchte ich Sie auch noch auf ein anderes Buch von mir hinweisen, das die Erkenntnis von eben auf die Finanzbranche anwendet: Können Roboter mit Geld umgehen? Hier beschreibe ich, wie weit die Roboter schon sind, um Menschen als Berater abzulösen. Wir werden uns noch umsehen, wie viel mehr die künstlichen Intelligenzen können und welche Auswirkungen das hat.

Und vergessen Sie nicht, mir auf Twitter zu folgen: @ProfRieck.

Und hier einen Kommentar zu hinterlassen…

 

Wieviele Steuerfahnder braucht das Land?

Jeder Steuerfahnder bringt dem Staat eine Million jährlich – daher brauchen wir mehr davon. Sagt die Deutsche Steuergewerkschaft. Aber sie irrt sich. 

Das Fahnder-Spiel ist eines der klassischen Spiele in der Spieltheorie: Es lässt sich in der einfachsten Form als ein Spiel mit zwei Spielern modellieren: einen Spieler, der etwas Verbotenes tun kann, und einen, der stichprobenartig nachprüfen soll.

Diese Situation kann man in der Normalform folgendermaßen darstellen (die erste Zahl in Klammern ist die Auszahlung an den Steuerzahler, die zweite Zahl die Auszahlung für die Steuerfahnderin):

Steuerfahnderin:

nicht
prüfen

prüfen

ehrlich
versteuern

(0,0)

(0,-1)

Steuerzahler:

hinterziehen

(1,0)

(-S, B-1)

Wir setzen hier den ehrlichen Steuerzahler als den Referenzpunkt: Er erhält eine Auszahlung von null, egal, was die Fahnderin macht (wie gesagt, in der Grundform; in der Realität würde ich mich hier nicht für alle Fahnderinnen verbürgen, denn „irgendetwas finden sie immer“, wie man in einschlägigen Steuerbüchern nachlesen kann; aber lassen wir das hier der Einfachheit halber beiseite). Und nur zur Sicherheit: Eine Auszahlung von null heißt hier nur, dass wir diesen Punkt als Referenzpunkt für die anderen Auszahlungen definieren.

Das gleiche machen wir bei der Fahnderin: Bei ihr ist der Referenzpunkt das Nicht-Prüfen, für den wir uns vorstellen, dass es ihr egal ist, ob sie einen Steuerhinterzieher durch Untätigkeit nicht erwischt (schließlich ist sie – wie ich – Beamtin). Prüft sie hingegen, dann kostet sie das eine Auszahlung von -1; das ist der Preis für ihren Prüfaufwand. Er ist verloren, wenn sie nichts findet, aber wenn sie den Hinterzieher erwischt, dann bringt ihr das einen Bonus in Höhe von B, allerdings abzüglich der Prüfkosten in Höhe von -1 [3]. Der Bonus muss kein Geld sein, sondern kann auch Ansehen bei ihrem Chef oder Freund sein. Des weiteren gehen wir hier davon aus, dass sie einen echten Hinterzieher im Fall einer Prüfung immer erwischt und einen ehrlichen Steuerzahler ebenfalls immer (an-) erkennt.

Für den Steuerzahler wird es erst spannend, wenn er hinterzieht. Statt der langweiligen 0 erhält er hier entweder die Auszahlungen von 1 (wieder eine Normierung, aber sagen wir aus gegebenem Anlass ruhig einmal, das sei eine Million) oder die Strafe S, die natürlich negativ ist.

Bitte beachten Sie, die Auszahlungen nicht über die Spieler hinweg vergleichbar sind, sondern nur innerhalb eines Spielers. Auch falls der Bonus B der Fahnderin nur Kleinkram gegenüber den Beträgen des potenziellen Steuerhinterziehers sein sollte, ist er für sie wichtig. Insbesondere ist das Verhältnis zu den Prüfkosten wichtig.

 

So prüft die optimale Steuerfahnderin

Wo liegt nun die Lösung dieses Spiels? Die einfache Antwort: Es gibt keine eindeutige Lösung in „reinen Strategien“, sondern nur in gemischten Strategien. Anschaulich heißt das: Beide müssen zufällig mal das eine, mal das andere tun. Würde der Steuerzahler immer hinterziehen, wäre es nicht optimal für ihn, weil dann die Fahnderin immer prüfen könnte und jedes Mal ihren Bonus bekommen würde. Daher würde sich der Steuerzahler nicht so verhalten, denn er bekäme dann jedesmal die Strafe. Ein Gleichgewicht entsteht hier erst, wenn beide Spieler maximal unberechenbar sind, und das ist nur dann gegeben, wenn sie ihre Strategien zufällig wählen. Vermutlich ist es übrigens auch genau das, was die echten Fahnderinnen bzw. Außenprüferinnen auch tun: Sie haben zwar Kriterien, nach denen sie die Wahrscheinlichkeiten festlegen, aber innerhalb der verschiedenen Gruppen wählen sie vermutlich weitgehend zufällig aus.

Bleibt nur noch die Frage, mit welcher Wahrscheinlichkeit sie zwischen den beiden Strategien zufällig auswählen sollten. Um das auszurechnen, geben wir den Wahrscheinlichkeiten erst einmal Namen, mit der die beiden Spieler Ihre reinen Strategien auswählen: q ist die Wahrscheinlichkeit, mit der der Steuerzahler hinterzieht, p ist die Wahrscheinlichkeit, mit der die Fahnderin prüft. In die Matrix eingetragen sieht das so aus:

Steuerfahnderin:

1-p
nicht
prüfen

p
prüfen

1-q: ehrlich

(0,0)

(0,-1)

Steuerzahler:

q: hinterziehen

(1,0)

(-S, B-1)

Dann kaufen Sie sich mein Spieltheorie-Buch und lesen dort genau nach, wie man das Gleichgewicht in gemischten Strategien im Detail berechnet. Es läuft aber darauf hinaus, dass wir nun die Wahrscheinlichkeit für alle vier Spielausgänge abhängig von den beiden Einzelwahrscheinlichkeiten p und q schreiben und dann in der so entstandenen Funktion das Auszahlungsmaximum des jeweiligen Spielers in Abhängigkeit von seiner eigenen Wahrscheinlichkeit suchen. Mit anderen Worten, wir fragen uns: Mit welcher Wahrscheinlichkeit muss die Fahnderin prüfen, damit sie (im Erwartungswert) die maximale Auszahlung bekommt? Gleichzeitig fragen wir uns auch: Mit welcher Wahrscheinlichkeit sollte der Steuerzahler hinterziehen, damit er den maximalen Gewinn hat?

Zwei Ableitungen später kommt als Ergebnis heraus: q = 1/B und p = 1/(1+S). Wer es nachvollziehen will: Wie gesagt, sehen Sie in einem guten Spieltheorie-Buch nach und schreiben mir, falls ich mich verrechnet habe. Alle anderen glauben mir das Ergebnis einfach und interpretieren es mit mir:

q = 1/B heißt: Je höher der Erfolgsbonus für die Fahnderin, desto seltener sollte der Steuerzahler hinterziehen. Allerdings ist die Funktion eine Hyperbel: Dass es überhaupt einen Bonus gibt ist wichtig, aber er bewirkt immer weniger zusätzlich, je höher er wird.

p = 1/(1+S) hat ebenfalls eine ebenso anschauliche wie plausible Interpretation: Je höher die Strafe im Entdeckungsfall ist, desto seltener braucht die Fahnderin zu prüfen. Klar, denn dann traut sich der Steuerzahler nur seltener zu hinterziehen. Aber die Formel hält noch eine Überraschung für die Steuergewerkschaft bereit: die optimale Prüfwahrscheinlichkeit liegt sehr weit von 100% entfernt. Versuchen wir einmal, die Werte abzuschätzen:

Wie hoch ist die Strafe S im Vergleich zur möglichen Steuerersparnis? Die Antwortet lautet (aller Neiddebatte zum Trotz): die Strafe ist verdammt hoch. Auf Steuerdelikte gibt es bis zu 10 Jahren Haftstrafe, das ist vergleichbar mit Totschlag. Außerdem ist für jeden unbescholtenen Bürger die Karriere nach einer solchen Aktion ein für alle mal beendet. Herr Zumwinkel hätte mit Sicherheit allein an Gehalt und möglicher Abfindung weit mehr bekommen als die Million, die er hinterzogen haben soll. Der Imageverlust ist ebenfalls weit höher als eine Million für ihn. Sagen wir also einmal, die Strafe sei S = 5. Dann ist die optimale Prüfwahrscheinlichkeit für die Fahnderin p = 1/(1+5) = 1/6. Das ist mit Sicherheit ziemlich nah am echten Wert. Für uns Normalverdiener ist S sicherlich noch viel höher, weil wir im Vergleich zur möglichen Ersparnis so riesige Transaktionskosten haben. Daher reicht für den Kleinsteuerzahler schon eine Prüfwahrscheinlichkeit von 1/20, um aus staatlicher Sicht optimal zu sein.

So weit die Berechnungen. Aber was passiert eigentlich, wenn die Prüferin meine Formeln einfach nicht glaubt und häufiger prüft? Ganz einfach: Sie bekommt weniger Bonus. Denn die Reaktion des Steuerzahlers darauf ist, dass er seltener hinterzieht. Daher wendet sie jeweils die Prüfkosten auf, nur um festzustellen, dass er nicht hinterzogen hat. Das wird teuer für sie.

 

Wie die Fahnderin, so die Kanzlerin

Nun können wir auch eine Abstraktionsstufe höher gehen: Nicht mehr die Fahnderin spielt gegen den Steuerzahler, sondern die Bundeskanzlerin gegen die Steuerzahler. Auch sie bekommt durch die Prüfung im Erfolgsfall einen Bonus (das sind die zusätzlich erhobenen Steuern und die Strafen), und auch sie entscheidet über die Wahrscheinlichkeit, mit der geprüft wird (mittels der Anzahl der Prüferinnen). Auch hier gilt: Es kommt nicht auf die Höhe des Bonus im Vergleich zum Steuerzahler an, sondern auf den Vergleich zu den Prüfkosten und zur Nicht-Prüfung, die wir auch für die Kanzlerin als null normiert haben. Folglich gelten für sie die gleichen Formeln wie für die einzelne Fahnderin. Und auch hier gilt: Zu viel prüfen ist nicht optimal, sondern führt dazu, dass sie durch die Prüfkosten mehr verliert als sie durch die Prüfungen gewinnt.

Was zu der Aufgabe führt, die Prüfkosten einmal abzuschätzen. Die liegen nämlich keineswegs in dem (eher geringen) Beamtenlohn, sondern in dem Teil der Reaktionen der Steuerzahler, die wir hier nicht mit abgebildet haben. Denn einmal Hand aufs Herz: Wollen Sie in einem Überwachungsstaat leben? Schon dieser Verlust an Lebensqualität ist Teil der Kosten, aber glauben Sie, dass die „Reichen“ sich das gefallen lassen? Vermutlich wären die „Reichen“ die ersten, die das Land verlassen. Und die weniger Reichen machen etwas stilleres, das in der Wirkung aber mindestens ebenso dramatisch ist: Sie arbeiten weniger, weil hohe Steuern den Anreiz zur Arbeit verringern. Und das dürften die eigentlichen Kosten der übertriebenen Überwachung sein. Es ist kein Wunder, dass einige Bundesländer weniger streng prüfen als andere. Diese Länder haben erkannt, dass es Standortpolitik sein kann, durch weniger rigide Prüfungen arbeitsame Menschen anzuziehen, die dann in der Summe trotz geduldeter kleiner Schummeleien doch mehr Steuern zahlen als die „faulen Ehrlichen“.

Lohnt sich Steuerhinterziehung?

Vielleicht fragen Sie sich nun, ob sich Steuerhinterziehung vielleicht doch lohnt, wo doch die Bundeskanzlerin aus Eigennutz nur mit recht geringer Wahrscheinlichkeit prüfen lassen sollte. Auch darauf hat unsere kleines Modell eine sehr präzise Antwort: Es lohnt sich nicht. Das Optimum für die Prüferin schreibt nämlich vor, genau so viel zu prüfen, dass es sich für den Steuerzahler gerade eben nicht lohnt zu hinterziehen, weil er bei Hinterziehung im Erwartungswert ebensoviel bekommt wie bei Steuerehrlichkeit: in beiden Fällen null. Daher können Sie sich jetzt einfach zurücklehnen und es so machen, wie Sie es schon immer getan haben: alles brav deklarieren. Die Prüfwahrscheinlichkeit ist in Verbindung mit der Strafe gerade genau so hoch, dass Sie sich durch Hinterziehen nicht verbessern können.

Aber: Einige unter Ihnen werden mir das nicht glauben. [2] Und wenn es mir alle glauben würden, würde es auch nicht stimmen.[1] Daher wird es immer einige unter Ihnen geben, die eben doch versuchen, Steuern zu hinterziehen. Genau deshalb muss unsere Fahnderin doch immer wieder prüfen. Nur nicht zu oft.

 

Prüfungswahn und zu wenig Kontrolle

Der hier besprochene Zusammenhang taucht übrigens auch bei anderen Gelegenheiten auf, nicht nur bei der Steuer. Haben Sie sich zum Beispiel einmal gefragt, weshalb es vergleichsweise wenig Radarfallen gibt? Viele halten mich für zynisch, aber es gibt einen einfachen Grund dafür: Weil es die Einnahmen durch Strafen maximiert. Gäbe es zu viele Kontrollen, würde niemand mehr zu schnell fahren und die Einnahmen wären für den Staat dahin. Genau das ist übrigens wieder mal der DDR passiert: Auf der Transitautobahn nach  Westberlin gab es für die marode DDR-Wirtschaft eine tolle Einnahmequelle durch Strafzettel für Wessi-„Raser“, denn Westmark waren für die DDR-Diktatoren sehr viel wert. Leider war das DDR-Regime so kontrollbesessen, dass sie überkontrolliert haben. Hinter jedem Baum stand eine Radarfalle in der Hoffnung auf Westmark, mit dem Erfolg, dass niemand zu schnell fuhr. Daher waren die Einnahmen viel geringer als sie hätten sein können. Kommt davon, wenn man es mit der Überwachung übertreibt.

In die gegenteilige Falle ist Mercedes getappt. Autos von Mercedes hatten einmal eine so hohe Qualität, dass es nur eine verschwindend kleine Fehlerquote gab, die von der Endkontrolle an Ende der Fertigung aufgedeckt wurde. Was lag näher als einfach die Endkontrollen einzustellen, die ja sowieso fast nie etwas gefunden haben? Leider war das ein verhängnisvoller Fehler. Denn ein Blick auf unser Kontroll-Spiel zeigt, was passiert, wenn es keine Kontrollen mehr gibt: Die Fertiger beginnen zu schlampen. Mercedes hat (zumindest eine Zeit lang) übersehen, dass die Fehlerquote nur deshalbso gering war, weil es die Kontrollen gab. Der Sinn der Endkontrolle war also keineswegs, Fehler zu finden, sondern Fehler zu verhindern.

Genau so ist es bei der Steuerfahndung: Nicht der Erlös aus Steuernachzahlungen ist der eigentliche Gewinn der Steuerfahndung, sondern der Gewinn ist die gewonnene Steuerehrlichkeit durch die Möglichkeit der Entdeckung bei Hinterziehung. Aber alle Hinterziehung vollständig verhindern zu wollen, wäre für die Staatskasse ein schlechtes Geschäft. Und für die Menschen allemal.

dreamstime_s_47245405

 

Das Dilemma der Steuereintreiber

Ich habe oben argumentiert, dass Bundesländer mit sanfteren Steuereintreibern eventuell mehr Steuern bekommen, weil sich dort die Firmen lieber ansiedeln. Ein Leser meiner Seite weist auf einen interessanten Sachverhalt hin, der hier mit hineinspielt. Es gibt nämlich ein übles Dilemma der Bundesländer:

<Zitat:> Es gibt leider noch einen zweiten Grund für dieses Länderverhalten: die unsägliche Ausgestaltung des Länderfinanzausgleichs. Die „Grenzbelastung“ eines Nettozahlers im Länderfinanzausgleich ist extrem hoch. (Meines Wissens in der Regel über 90%. Umgekehrt ist auch der „Grenzertrag“ eines Netto-Empfängers sehr hoch. Sinkende Steuer-Einnahmen werden diesen Bundesländern ebenfalls zu über 90% kompensiert).
Von einem zusätzlich eingenommenen Steuer-Euro bleibt einem Bundesland daher fast nichts, ganz egal ob es Nettozahler oder Nettoempfänger ist.

Zusätzlich kommt erschwerend hinzu, dass die Finanzämter zwar von den Bundesländern betrieben werden, jedoch auch für die Einziehung der Bundessteuern zuständig sind. Es besteht hier also ein schwerwiegendes Moral-Hazard-Problem:

Das Bundesland profitiert nur im niedrigen einstelligen Prozentbereich von den durch seine Finanzbeamten eingetriebenen Steuern.
Den Kontrollaufwand bezahlen muss es aber voll (und zwar sowohl den direkten Kontrollaufwand als auch die von Ihnen zu recht angesprochenen „indirekten“ Kosten durch Anpassungs-Reaktionen seiner Steuersubjekte). <Zitat Ende>

Das sind außerordentlich interessante Argumente. Ich habe die zugrundegelegten Zahlen nicht nachgeprüft, aber auch bei abgeschwächten Zahlenwerten würden die Argumente noch in vollem Umfang gelten. Das zeigt, dass es sich für Politiker lohnt, einmal vorher die Konsequenzen der Mechanismen zu durchdenken, die sie in Gesetze fassen.

 

Lust auf weitere spieltheoretische Analysen? Dann werfen Sie doch einmal einen Blick in das von mir übersetzte BuchCoopetition – Spieltheorie im Geschäftsleben.

 

____________________

[1] Wieso eigentlich nicht? Die Begründung geht ein wenig um die Ecke: Wenn alle Steuerzahler ehrlich wären, dann brauchte man sie nicht zu prüfen. Wenn aber nicht geprüft wird, dann lohnt es sich, Steuern zu hinterziehen. Der Zustand, dass alle ehrlich sind, zerstört sich daher von selbst – er ist eben kein Gleichgewicht. Der erste Denkschritt der ebigen Argumentation taucht übrigens auch in dem Fallbeispiel der Endkontrollen von Mercedes auf.

[2] Ich halte die Quintessenz des hier verlinkten Artikels übrigens für vollkommen verkehrt: Demokratische Gesetze sind dafür da, eine gesellschaftliche Übereinstimmung zu institutionalisieren. Wenn Gesetze einen so wesentlichen Teil der Bevölkerung kriminalisieren wie in dem Artikel behauptet (sofern das denn zutrifft), dann stimmt etwas mit den Gesetzen nicht, nicht mit den Menschen. Mit immer mehr staatlicher Brutalität zu reagieren ist keine demokratische Verhaltensweise, sondern der schleichende Beginn einer Diktatur. Das gilt nicht nur hier, sondern auch in anderen Bereichen wie Jugendkriminalität oder Straßenverkehr. Gesetze sind dafür da, dass es den betroffenen Menschen besser geht, nicht schlechter. Wenn die Gesetze dieses Ziel nicht erreichen, dann muss man sie ändern.

[3] In der Version dieser Seite vor dem 20.11.09 hatte ich vergessen, in der Matrix die Prüfkosten von dem Bonus abzuziehen, daher stand damals (fälschlicherweise) als Auszahlung bei Prüferfolg der Betrag B statt jetzt B-1. Die nachfolgenden Rechnungen basierten aber auf der korrekten Matrix, sodass sich an den Ergebnissen nichts ändert. Ich bedanke mich an dieser Stelle noch einmal ganz herzlich bei einem netten Mathematik-Lehrer und seinem Mathematik-Seminar, dass sie mich darauf aufmerksam gemacht haben.