Variable Belohnungen

Konditionierung ist eines meiner Lieblingsthemen. Hauptsächlich im beruflichen Umfeld. Natürlich hat das privat genau so Auswirkungen, aber es geht mir hier speziell um berufliche Themen (z.B. GUI, Software-Entwicklung, Kundensupport, Marketing und Projektmanagement). Allgemein denkt man als Mensch ja, immer selbstbestimmt zu denken und zu handeln. Ist aber nicht so. Wir sind bei extrem vielen Prozessen auf eine bestimmte Handlungsweise konditioniert ohne dies überhaupt zu realisieren. Faktisch sind das Automatismen, die wir oft nicht mal erkennen und entsprechend fast nie hinterfragen. In diesem Text geht es um mein Lieblings-Unterthema “variable Belohnungen” (variable rewards). Wenn man das Prinzip und die Konsequenzen verstanden hat und sich hin und wieder einmal darüber Gedanken macht, dann hat das Auswirkungen auf sehr viele Geschäftsprozesse und Workflows.

BTW: Um Zeit zu sparen, benutze ich in diesem Text ChatGPT Zitate, ohne dies jedes mal zu markieren.

Basics zum Thema Konditionierung

Konditionierung ist ein Prozess, bei dem Verhaltensweisen durch Belohnung oder Bestrafung erlernt werden. Es gibt zwei Arten von Konditionierung: klassische Konditionierung und operante Konditionierung.

Bei der klassischen Konditionierung wird einem Individuum ein neutrales Stimulus (z.B. ein Ton) präsentiert, gefolgt von einem natürlichen Reiz (z.B. einem Leckerbissen). Nach wiederholter Präsentation dieser beiden Stimuli wird das Individuum dazu neigen, auf den neutralen Stimulus mit der gleichen Reaktion wie auf den natürlichen Reiz zu reagieren.

Das Experiment vom Pawlowschen Hund, ist das bekannteste Beispiel zur klassischen Konditionierung (es ist übrigens auch das erste Experiment zu diesem Thema und quasi die Geburtsstunde aller Arbeiten über Konditionierung). Der Russe Ivan Pavlov präsentierte einem Hund einen neutralen Stimulus (das Gebimmel einer Glocke), schnell (und das die Geschwindigkeit ist wichtig) gefolgt von einem Leckerbissen, und beobachtete, dass der Hund nach einigen Wiederholungen dieses Ablaufes auf den Ton alleine zu sabbern begannen, als würden er das Futter erwarten. Dieses Experiment zeigte, wie Tiere (und Menschen!) dazu gebracht werden können, auf neutralen Stimuli zu reagieren, indem man sie mit einem natürlichen Reiz konditioniert.

Wer einen Hund hat, kennt die Anwendung der klassischen Konditionierung. Das Training zielt darauf ab, das der Hund sich auf den Befehl “Sitz” hinsetzt und quasi als Gegenleistung ein Leckerli bekommt. Das mit der Gegenleistung ist aber eine Vermenschlichung. Der Hund macht das nicht als geschäftliche Transaktion. Er wurde darauf konditioniert.

Bei der operanten Konditionierung wird das Verhalten eines Individuums durch Belohnung oder Bestrafung modifiziert. Wenn ein Individuum ein gewünschtes Verhalten zeigt, wird es belohnt, wodurch es wahrscheinlicher wird, dass das Verhalten in Zukunft wiederholt wird. Wenn ein Individuum ein unerwünschtes Verhalten zeigt, wird es bestraft, wodurch es weniger wahrscheinlich wird, dass das Verhalten in Zukunft wiederholt wird. Meistens wird unerwünschtes Verhalten allerdings einfach ignoriert. Bestrafung ist bei Konditionierung ein ganz heißes und gefährliches Eisen. Bei Interesse (warum es gefährlich ist) kann ich dazu gerne mal einen eigenen Text schreiben. Nur so viel: Ein Beispiel für Bestrafung ist die heiße Herdplatte. Die fasst man genau einmal im Leben freiwillig an.

Auch hier gibt es für die Hunde Interessierten unter uns ein Beispiel aus der Hundeschule: Das Klickertraining. Dabei werden Verhaltensweisen von Tieren (mein Lieblingstier ist in diesem Kontext das Huhn (YouTube Video zum Klickertraining mit Hühnern) rein durch operante Konditionierung verändert. Für Fans der TV Serie “Big Band Theory” möchte ich hier noch auf diesen kurzen YouTube Clip hinweisen, in dem Sheldon Penny mit Schokolade konditioniert (auch eine operante Konditionierung).

Man muss sich im Klaren darüber sein, das im täglichen Leben operante und klassische Konditionierung Hand in Hand gehen.

Die konditionierte Person oder das Tier sind sich meistens nicht darüber bewusst. Sie reagieren einfach auf den Stimulus, ohne zu wissen, dass sie auf ihn konditioniert wurden.

Belohnt man immer gleich (gleiche Menge, Qualität und Timing) dann nennt man das konstante Belohnung. Timing ist noch mal ein ganz eigenes Thema. So viel vorweg: Mann kann nicht erst nach 10 Minuten eine Belohnung geben. Also man kann schon, aber dann resultiert es nicht in einer Konditionierung. Konditionierung funktioniert nur, wenn die Belohnung unmittelbar erfolgt.

Variable Belohnungen

Variable Belohnungen beziehen sich auf Belohnungen, die nicht immer in der gleichen Menge oder mit der gleichen Häufigkeit gegeben werden. Sie kommen quasi als Überraschung.

Variable Belohnungen können in der operanten Konditionierung (das war das mit dem Klickertraining) verwendet werden, um das Verhalten eines Individuums zu modifizieren. Sie sind besonders wirksam, weil sie das Individuum dazu veranlassen, das gewünschte Verhalten weiterhin zu zeigen, auch wenn die Belohnungen nicht immer sofort gegeben werden. Die Unsicherheit, ob und wann eine Belohnung gegeben wird, kann das Interesse und die Motivation des Individuums steigern.

Das klassische Beispiel ist der Glücksspielautomat. Bei dem werden nicht bei jedem Spiel Gewinne ausgeschüttet und die Gewinnmenge wird auch variiert. Diese Kombination ist extrem erfolgreich und für viele Menschen eine Katastrophe. Von der daraus resultierenden Spielsucht sind in Deutschland offiziell gut 200.000 Menschen betroffen. Über die Dunkelziffer möchte ich gar nicht nachdenken. Und jetzt kommen wir zur Auswirkung auf den Bereich, in dem ich beruflich unterwegs bin. Wenn eine Support-Hotline auf eine einzelne Anfrage sehr schnell und extrem gut antwortet, dann ist das eine variable Belohnung. OK, wenn das immer passiert, ist das natürlich keine variable Belohnung mehr, aber die meisten Support-Hotlines haben ja starke Schwankungen in der Qualität. Es reicht also schon eine sehr große variable Belohnung, das der Kunde sich denkt “ehe ich jetzt selber google frage ich schnell mal beim Support an”. Dabei “denkt” der Kunde gar nicht wirklich. Er/Sie wurde von uns zu dieser Handlung unbewusst (in diesem Fall unbewusst für beide Seiten) konditioniert.

Ein anderes Beispiel sind soziale Netzwerke wie TikTok, Facebook und Twitter. Nicht jedes TikTok bzw. YouTube Video ist lustig oder interessant. Aber hin und wieder gibt es sehr lustige und sehr interessante Videos. Aus diesem Grund nimmt man es in Kauf zahllose mittelmässig lustige und interessante Videos zu sehen. Man “arbeitet” auf die nächste große variable Belohnung hin. TikTok konditioniert seine User darauf hin immer weiter mit dem Finger von unten nach oben zu wischen. Dieses Wischen wird mit einer variablen Belohnung (ein lustiges oder interessantes Video) belohnt.

Wie wird eine Konditionierung wieder abgebaut?

Wenn man nicht mehr belohnt, wird die Konditionierung abgebaut. Stück für Stück. Wenn ich meinen Hund für ein Sitz nicht mehr belohne, dann wird er es wahrscheinlich schon nach ein paar Tagen nicht mehr machen. Dieses aus-faden dauert bei der variablen Konditionierung deutlich länger. Deshalb benutze ich bei meinem Hund übrigens variable Konditionierung. OK, deshalb und weil es auch im Alltag praktischer ist. Man hat ja nicht immer ein Leckerli dabei und will das Sitz auch mal so abrufen können.

Anwendung

Oft höre ich von Marketingleuten, das es wichtig ist eine vorhersehbare Regelmässigkeit zu realisieren. Also immer jede Woche am gleichen Tag einen Podcast oder einen Newsletter zu veröffentlichen. Das ist an sich natürlich kein falscher Ratschlag. Allerdings bekommt man mit der variablen Belohnung einen viel grösseren/besseren Effekt. Wenn ich jeden Montag einen neuen Blog-Eintrag veröffentliche, dann werden alle Interessierten sich das sehr schnell merken (es wird konditioniert!) und sie schauen am Montag auf meinen Blog. Wenn ich aber unregelmässig poste, dann schauen die Interessierten öfter rein, denn es könnte ja sein, das etwas neues da ist.

Ebenfalls ist es nicht so wichtig, das man jedes mal einen perfekten Beitrag (Blog-Post, Podcast-Episode, what-not) erstellt. Wichtig ist, das man hin und wieder einen absoluten Knaller dabei hat. Also eine sehr große Belohnung!

Wer regelmässig und immer gleich belohnt (z.B. jeden Montag veröffentlicht) und dies einmal (z.B. wegen einem Feiertag) nicht macht, der erzeugt negative Gefühle. Wer aber variable belohnt, das erzeugt positive Gefühle.

Dabei sage ich nicht, das es prinzipiell schlecht ist immer zum gleichen Zeitpunkt und damit für die Gegenseite planbar zu belohnen. Ich finde es gut, das die Tagesschau jeden Tag pünktlich um 20:00 Uhr ausgestrahlt wird. Aber man sollte sich über das Konzept der Konditionierung und die Möglichkeiten der variablen Belohnung im Klaren sein.

Die Tagesschau ist nie so spannend wie eine unregelmässig erscheinende Sondersendung zu einem besonderen Ereignis nach der Tagesschau.

Variable Belohnungen für Kunden

Es ist wichtig einen Kunden mit guter und sehr guter Arbeit glücklich zu machen. Das ist natürlich wichtig in allen menschlichen Beziehungen (Stichwort Karma), aber behalten wir hier mal plump das geschäftliche im Auge. Wenn man es schafft hin und wieder einem Kunden auch einmal eine besonders gute Arbeit zu präsentieren, dann kann man damit das System der variablen Belohnungen ausnutzen. Denn es wird auch einmal vorkommen, das man nur Mittelmaß abliefert (wir sind alle nur Menschen).

Problematisch wird das ganze bei kostenlosen Dienstleistungen. Gerade im Support und im Social Media Bereich zieht man sich dabei ganz schnell Brieffreunde hoch. Ich habe einmal eine Influencerin dabei beobachtet, wie sie bei einer Reise ständig auf Kommentare zu Instagram-Fotos reagiert hat, obwohl sie eigentlich gar keine Lust dazu hatte. Sie hat sich (unbewusst) durch variable Konditionierung einen Blumenkorb an Brieffreunden gezüchtet. Diese waren es gewohnt nicht jedes mal eine Antwort zu bekommen. Aber hin und wieder haben Sie eine Antwort oder ein Like bekommen und diese Belohnung war so stark, das sie weiterhin kommuniziert haben.

Achtung Gegenverkehr

Konditionierung ist keine Einbahnstrasse. Ich versuche meinen Hund durch Konditionierung zu “erziehen”. Mein Hund macht das gleiche aber auch anders rum. Oft viel erfolgreicher. Fast immer auch mit einer variablen Belohnung. An der Leine ziehen ist ein sehr gutes Beispiel dafür. Das bringt fast nie was. Aber manchmal halt schon und das ist dann direkt eine sehr große Belohnung. Das ist dann auch der Grund, warum manche Hunde so gerne an der Leine ziehen. Sie haben “gelernt”, das es hin und wieder funktioniert.

Bei Menschen ist das genauso. Besonders auffallend ist das oft im Konstrukt Eltern-Kind. Kinder haben schnell raus, wie sie ihre Eltern “um den Finger wickeln”. Da wird an der Supermarktkasse gejammert, um eine Süßigkeit zu bekommen. Eltern belohnen das variabel (meist aus Stress und weil man im täglichen Leben einfach auch nicht immer an die Mechanismen der Konditionierung denkt). Das Kind bekommt also einmal eine Süßigkeit. Diese Belohnung ist so groß, das es immer wieder jammern wird. Ich möchte mal den perfekten Trainer sehen, der so was immer direkt erkennt und dann richtig handelt.

Besonders lustig finde ich es, wenn Menschen, die sich beruflich sehr viel mit Konditionierung beschäftigen (z.B. Tiertrainer), von ihren eigenen Kindern unbewusst ebenfalls konditioniert werden.

Moralische Aspekte

Wenn ich meinen Hund durch Konditionierung mit positiver variabler Belohnung erziehe, dann ist das moralisch absolut unproblematisch. Wenn man aber andere Menschen ungefragt in Ihren Handlungen bewusst beeinflußt, dann sollte man sich darüber mal Gedanken machen. Karma is a bitch!