Das Design von GWENT, Teil 2: Balancing

Willkommen zur Artikelreihe zum Design von GWENT. In regelmäßigen Abständen wollen wir euch damit einen Einblick in die Konzepte gewähren, die GWENT ausmachen, sowie Designphilosophie und andere Themen beleuchten. Teilt uns gern mit, welche Themen ihr in dieser Sparte sehen wollt!

Von Anfang an war einer der Hauptunterschiede zwischen GWENT und der Konkurrenz unsere Bereitschaft, Balancing-Patches herauszubringen und Spielmechaniken weiterzuentwickeln. Heute sehen wir uns genauer an, wie und warum diese monatlichen Updates gemacht werden, die dem Leben des Spiels wie auch der Community einen Rhythmus geben.

Dafür müssen wir zuerst etwas ausholen und über das "Metagame" sprechen. Ihr habt vielleicht schon von "META" als Akronym für "Most Efficient Tactics Available" ("effizienteste verfügbare Taktiken") gehört. Auch wenn das super klingt, ist es in diesem Falle eher umgekehrt. Denn das Wort Metagame wird mit dem Präfix "meta" gebildet, griechisch für "jenseits von". "Metagame-Interaktionen" zum Beispiel sind Interaktionen mit Gegnern, die jenseits der gegebenen Spielregeln stattfinden. Dazu gehören das Verspotten von Gegnern, um sie zu stören, oder – im Fall von GWENT – das Einsetzen von Emotes, wenn ihr nur noch eine Karte auf der Hand habt und hofft, dass euer Gegner aufgibt, weil ihr sonst verliert.

Noch öfter jedoch wird das Wort Metagame benutzt, um zu beschreiben, wie ein Spiel zu einer bestimmten Zeit in einer bestimmten Community gespielt wird. Ersteres ist offensichtlich, denn je mehr Zeit vergeht, desto mehr verändert sich die Spielweise, weil die Spieler neue Strategien finden, sich verbessern oder an frühere Strategien anpassen, und das selbst dann, wenn das Spiel dasselbe bleibt.

Jetzt zum Community-Aspekt: Stellt euch vor, ihr besucht jede Woche denselben Ort, um ein physisches Kartenspiel zu spielen. Dort trefft ihr jedes Mal auf 10 bis 20 Spieler. Davon sind über die Hälfte "normale" Spieler, die beeindruckende Strategien bevorzugen, ein Viertel spielt kompetitiv, und der Rest besteht aus Experimentierfreudigen sowie Leuten, die sich auf ein bestimmtes Deck eingeschossen haben. Ihr könntet jetzt ein "optimales" Deck spielen, das ihr auf Basis von Berichten im Internet über die letzten Wettkämpfe zusammengestellt habt. Damit erhaltet ihr aber nur dann die besten Ergebnisse, wenn ihr euch zudem an euer spezifisches Umfeld anpasst. Zum Beispiel absichtlich ein breitgefächertes Deck mitzubringen, weil Johnny eine ungesunde Besessenheit für Geralt von Riva und andere Karten besitzt, die starke Ziele zerstören. "Suboptimale" Strategien zu spielen, weil sie die besten Ergebnisse in eurer jeweiligen Situation liefern, ist das, was Frank Lantz treffend als "Donkey Space" bezeichnet hat.

Obwohl das Ausweiten und die Abwesenheit von Grenzen im Internet (besonders bei automatischem Matchmaking) diesen Effekt bei digitalen Spielen abmildern, bleibt er trotzdem bestehen. Eins der besten Beispiele hierfür waren die ersten internationalen "League of Legends"-Turniere. Weil sie auf verschiedenen Servern unterwegs waren, hatten sich in der europäischen und der amerikanischen Community hinsichtlich der Rollen und beliebtesten Champions jeweils völlig unterschiedliche Metagames herausgebildet. Nach den anfänglichen Begegnungen setzten sich irgendwann die europäischen Methoden durch und die Standards der Regionen glichen sich einander an. Trotzdem war es faszinierend zu beobachten, dass zwei Communitys derart unterschiedliche Spielweisen entwickelten, obwohl sie dieselbe Sprache (Englisch) nutzten und sich an den gleichen Orten (Reddit, das Spielforum usw.) austauschten.

Ein weiteres Beispiel ist die Art und Weise, wie die Neuronalnetzwerk-KI "OpenAI" DotA spielt. Weit entfernt vom klassischen Moba-Metagame, bei dem es verschiedene Rollen mit unterschiedlicher Priorität in Bezug auf das Einkommen gibt, spielte sie in fluider, zielorientierter Weise und verteilte die Münzen gleichmäßig auf die Spieler, sodass alle effizient kämpfen konnten. Diese Ergebnisse werden zwar durch erstaunliche KI-Koordination und Entwicklungsverzerrung abgemildert (denn beides verhindert möglicherweise, dass ein Metagame wie das der Spieler entsteht, weil solch ein Prozess sehr viel Zeit in Anspruch nehmen würde), aber es stellt sich dennoch die Frage: Die KI gewinnt doch – spielt sie das Spiel dann trotzdem richtig? Schließlich fand selbst die Neigung der Neuronalnetzwerk-KI "AlphaStar" von Starcraft II’, ihre Stützpunkte mit Arbeitern zu überschwemmen, um sie widerstandsfähiger gegen Angriffe auf Kosten geringerer Effizienz zu machen, ihren Weg in die strategischen Herzen der Spieler.

Worauf ich damit hinauswill ist ein essenzielles Element von Metagames: Letztlich basieren sie auf der Subjektivität der Spieler. Ein Metagame besteht aus ihrer Wahrnehmung, ist also ein Mischmasch aus den jeweiligen Gegnern, der Community, zu der sie sich zählen, anderen Spielern, die sie inspirieren, ihren Spielvorlieben usw. Natürlich wird das Metagame auch durch den objektiven Zustand des jeweiligen Spiels beeinflusst, aber unterm Strich ist es zuallererst eine Interpretation der bestmöglichen Spielweise. Populationen sind im Internet zudem gespaltener, als man zunächst erwarten würde. Unterschiedliche Ränge, Zeitzonen und Gewohnheiten haben starken Einfluss auf die Spielergruppen, auf die man in Matches trifft. Darüber hinaus können Meinungen übers Spiel, Sprachbarrieren und auch eventuelle Lieblingsstreamer oder -foren eine große Rolle spielen. Meta-Berichte sind ein gutes Beispiel. Decklisten und Meinungen variieren stark, obwohl die Spieler, die sie zusammenstellen, relativ ähnlichen Communitys angehören.

 

Diese lange Einführung bringt mich nun zum Warum: Der Sinn von Balancing-Patches besteht darin, das Spiel unterhaltsamer zu machen. Hierfür dient Balancing zwar als Mittel, nicht jedoch als Zweck.

Typischerweise führt der leichteste Weg zu einem guten Balancing über die Symmetrie: Hätten alle Spieler jederzeit Zugriff auf dieselben Optionen, müssten wir uns ums Balancing keine Sorgen machen. Die Beliebtheit des asymmetrischen Gameplays zeigt jedoch, dass Spieler möglichst breit gefächerte Optionen bevorzugen, weil dadurch die Wiederspielbarkeit wächst. Der Nachteil? Das Balancing steht auf ewig wackligen Beinen.

Ein weiterer wichtiger Punkt ist, dass Balancing nicht unbedingt Informationen über das Gameplay bietet. Stellt euch ein Meta mit drei Decks in einer absoluten Schere-Stein-Papier-Beziehung vor. Obwohl das Spiel hinsichtlich durchschnittlicher Siegeschancen durchaus ausgeglichen wäre, wäre das Gameplay wenig zufriedenstellend, wenn ihr schon zu Partiebeginn mit Sicherheit wüsstet, ob ihr gewinnt oder verliert. Also müssen wir die Polarität in allen Matchups reduzieren, sodass sich jede Partie bis zu einem vernünftigen Grad "fair" anfühlt. Dabei wiederum alle Fälle einzubeziehen, ist allerdings mehr als schwierig. Und selbst die fairste Partie garantiert noch keinen Spielspaß. Ein Sieg kann durchaus unbefriedigend sein, wenn man das Gefühl hat, kein Mitspracherecht beim Verlauf der Partie gehabt zu haben. Umgekehrt kann sich nach einer besonders spannenden Partie selbst eine Niederlage gut anfühlen. Dieses Problem trat zum Beispiel mit dem alten Vipern-Hexer-Alchemisten auf (besser gesagt, dessen Erreichbarkeit in Gorthur Gvaed), denn obwohl die Karte durchschnittlich gesehen nicht wirklich stark war, löste sie bei manchen Spielern Frustration aus.

Deshalb geht es uns vornehmlich um die Spielerwahrnehmung und darum, wie sich eventuelle Veränderungen auf sie auswirken könnten. Nehmen wir zum Beispiel an, in einem Spiel existiert eine übermächtige Option, die aus den Spieldaten durchaus ersichtlich ist, in der Community aber als schwach wahrgenommen wird. Sie zu nerfen, würde bei besagter Community wahrscheinlich ungläubiges Staunen bewirken. Tatsächlich beobachten wir oft Diskrepanzen zwischen unseren Daten und dem, was Spieler als stark und schwach wahrnehmen, allerdings ist das Thema der Datennutzung im Balancing komplex und bräuchte einen eigenen Artikel.

 

Es ist also nicht immer offensichtlich, ob ein Balancing notwendig ist oder nicht. Wenn Entwickler jedes Mal eingreifen würden, wenn sich eine Community über etwas aufregt, kann das dazu führen, dass ebendiese Community immer weniger bereit ist, sich an das jeweilige Spiel anzupassen und gegebenenfalls selbst nach Antworten zu suchen. Manchmal reicht es schon aus, einer Sache Zeit zu geben. Einflüsse und Wahrnehmung verändern sich ganz von selbst, während Spieler nach neuen Strategien suchen und das Spiel immer besser verstehen lernen (einer unserer größten Fehler in diesem Zusammenhang war der Buff von Vipern-Hexer-Mentor in 8.2, der – durch die übliche Verzögerung zwischen Patch-Sperrung und -Lieferung – erst 10 Tage, nachdem alle ihre Decks richtig zu spielen verstanden, auftauchte).

Der Wunsch nach weniger häufigen Balancing-Patches ist unter Spielern keine Seltenheit, besonders in den Communitys von Kampfspielen, in denen Balancing-Patches üblicherweise weit auseinanderliegen und katastrophale Auswirkungen darauf haben können, wie sich ein Charakter beim Spielen anfühlt oder gespielt werden sollte. Natürlich gibt es Unterschiede zwischen Kampfspielen und Kartenspielen. Im Allgemeinen gilt die Faustregel, je mehr Möglichkeiten ein Spiel bietet (also je variabler das Ergebnis je nach Spielerentscheidung ausfallen kann), desto mehr können sich Spieler anpassen und desto mehr Zeit sollten sie bekommen, um die Spielbalance kennenzulernen.

Noch allgemeiner gesagt, kann ein Spiel, das sich zu schnell verändert, überfordernd auf Spieler wirken, während eines, das sich zu selten verändert, bald langweilig wird. Dabei variiert natürlich wiederum die Spielerwahrnehmung von "zu schnell" und "zu langsam", was ein kluges Balancing erschwert.


Damit komme ich zum nächsten Thema: Eine Community ist keine generische Masse. Normalerweise herrschen innerhalb einer Community stark auseinandergehende Meinungen, sodass es Entwicklern schwerfällt, eine absolute "Wahrheit" zu erkennen (schon allein, weil die selten existiert und die Dinge meist viel subtiler sind). Und selbst, wenn sich eine Community einig zu sein scheint, kann es immer noch schwierig sein, herauszufinden, wie viele Mitglieder dieser Community der vermeintlich vorherrschenden Meinung zustimmen. Schließlich ist es kein Geheimnis, dass Menschen deutlich lauter werden, wenn sie mit irgendetwas unzufrieden sind, als andersherum. So repräsentieren Beschwerden über ein bestimmtes Thema zwar bis zu einem gewissen Grad die Sichtweise der Community und beeinflussen sogar die Wahrnehmung anderer Mitglieder, aber es gibt auch immer Leute, die weniger leidenschaftlich über dasselbe Thema denken, aber weder die Lust noch die Notwendigkeit verspüren, dies kundzutun. Oft reagieren Letztere erst auf Balancing-Veränderungen, wenn sie schon geschehen sind, weil diese Spieler plötzlich unzufrieden damit sind, dass etwas geändert wurde, was sie gut fanden.

Das wirft folgende Frage auf: Wenn ein Deck oder eine Fraktion von einem Teil der Community gehasst (bestes Beispiel: Nilfgaard) und vom nächsten geliebt wird, sollte dann etwas verändert werden? Manchmal ist die Antwort offensichtlich, denn es mag zwar lustig sein, mit einer übermächtigen Karte zu spielen, aber jeder wird zustimmen, dass sie das Spiel insgesamt schlechter macht. Andere Situationen sind schon schwieriger, denn wenn man der Philosophie Glauben schenkt, kann das Bestreben, möglichst alle maximal glücklich zu machen, dazu führen, dass am Ende alle latent unzufrieden sind.

 

Wenn euch also einmal ein bestimmtes Deck oder eine Strategie auf die Nerven geht, denkt daran, dass es mit großer Wahrscheinlichkeit Spieler gibt, denen sie Spaß machen. Deshalb versuchen wir generell, Nerfs nicht destruktiv zu gestalten, denn zum einen wird ein Nerf definitiv ein paar Leute unglücklich machen, zum anderen kann er aber auch dazu führen, dass ein Deck ganz verschwindet, und damit hätten wir der Spieldiversität geschadet.

Das gelingt uns natürlich nicht immer, denn auch wir leiden unter "Nerf-Voreingenommenheit". Veränderungen werden als intensiver wahrgenommen, als der Ist-Zustand. So kann eine Karte, die einen wichtigen Nerf erhalten hat, von den Spielern aufgegeben werden, obwohl sie immer noch ziemlich gut ist (bei League of Legends gab es sogar den Fall, dass ein Charakter-Nerf angekündigt, aber dann vergessen wurde, und trotzdem sanken die Spiel- und Gewinnrate dieses Charakters). Danach kann es dauern, bis Spieler wieder bereit sind, mit einer Karte zu experimentieren und sie "neu zu entdecken". Zum Beispiel verschwand Wij nach den 8.2-Nerfs fast vollständig, nur um etwa 2 Monate später zurückzukehren.

Interessanterweise kann aber auch das Gegenteil passieren. Nerfs, die als ineffektiv wahrgenommen werden, werden oft ignoriert und beeinflussen die Spielrate einer Karte kaum, obwohl die Gewinnrate durchaus sinkt. Hierfür sind Rekrutierungskosten ein gutes Beispiel: Die Verteuerung einer Karte mag oft mit den Worten "dann muss ich eben eine Bronzekarte gegen eine schwächere austauschen" abgetan werden, aber trotzdem wird das Deck in manchen Szenarien schwächer. Auf lange Sicht häuft ein Verlust weniger Prozente an, die allerdings viel bedeuten können, wenn man bedenkt, dass nur 5 bis 6 Prozentpunkte über 50 nötig sind, um eine Karte als gut oder schlecht einzustufen. Aber das sind nur Statistiken, die in der Spielerwahrnehmung keine große Rolle spielen.

Gleichzeitig gab es in der Vergangenheit viele Fälle, bei denen einzelne Änderungen der Rekrutierungskosten massive Auswirkungen hatten: Nach Maxii Van Dekkars Buff in 8.2 stieg die Karte aus der Bedeutungslosigkeit zur Ikone der Wettkampfdecks auf, Eist Tuirseachs Nerf in 9.0 führte zum Verschwinden von Krieger-Decks, usw.

Ein weiterer interessanter Fall war Jackpot. Nach der Überarbeitung in 9.0 stand die Karte bei Rekrutierungskosten von 16 und dominierte damit die Fraktion. Ein Nerf in Höhe von 1 in 9.1 hatte zwar Auswirkungen, aber die Karte blieb dominant, während sie nach dem Nerf in Höhe von 2 Rekrutierungskosten-Punkten in 9.2 völlig verschwand ... Nur, um in 9.4 nach dem Nerf von Tunnelbohrer zurückzukehren und die Fraktion erneut zu übernehmen. Da Price of Power seinerzeit eher kleinere Auswirkungen aufs Syndikat hatte, zeigt sich, wie stark sich die Wahrnehmung rund um diese Anführerfähigkeit entwickelt hat. Außerdem fragt man sich doch automatisch: Wäre sie da, wo sie jetzt ist, wenn sie gleich mit Rekrutierungskosten von 13 oder 12 erschienen wäre?


Die Auswirkungen von Änderungen innerhalb eines stark vernetzten Systems vorherzusagen, ist schon schwer, aber wenn man auch noch die Spielerwahrnehmung miteinbezieht, wird das Ganze nahezu unmöglich.

Aber während selbst kleinste Nerfs derart große Folgen für die Wahrnehmung haben, wissen wir inzwischen, dass Buffs das genaue Gegenteil bewirken. Wenn ein Deck generft wird, haben Spieler normalerweise eine Ahnung von seiner Stärke, weil sie es regelmäßig einsetzen. So sind sie in der Lage, die Auswirkungen des Nerfs einzuschätzen. Gebufft werden aber meist weniger oder kaum gespielte Archetypen, sodass eine Einschätzung deutlich schwerer ist. Herauszufinden, ob es manche Karten nach einem Buff noch wert sind, gespielt zu werden, braucht Zeit und Hingabe. Daher ist es verständlich, dass sich die meisten Spieler gar nicht erst damit auseinandersetzen, wenn sich der Buff für sie nicht besonders stark anfühlt.

Deshalb haben wir uns vor Kurzem umorientiert und Buffs mit Archetypfokus eingeführt. Diese Herangehensweise ermöglicht uns zum einen ambitioniertere Änderungen, aber vor allem wirken Buffs und Änderungen durch die Bündelung spannender, sodass Spieler eher bereit sind, damit zu experimentieren und die fokussierten Archetypen auszuprobieren. Das heißt, selbst wenn sie sich irgendwann als zu schwach herausstellen sollten, haben sie dennoch vorübergehend so große Aufmerksamkeit erhalten und uns mit so vielen Daten versorgt, dass wir sie später aufpolieren können. Diese Herangehensweise führt allerdings manchmal dazu, dass wir verdiente Buffs mitunter verschieben, weil sie zu einem späteren Zeitpunkt mehr Aufregung verursachen und damit wirkungsvoller sind.

Zum Ende dieses Artikels über Balancing und Spielerwahrnehmung möchte ich darauf hinweisen, dass die Einbeziehung der Spielerwahrnehmung nicht immer heißt, dass die Community "recht hat". Im Verlauf des Artikels habe ich mehrfach belegt, dass die Community bei der Wahrnehmung eines Spiels voreingenommen sein kann, aber nun möchte ich ein breiteres Designprinzip ansprechen: Nutzer wissen zwar meist genau, wie sie sich fühlen, aber missdeuten oft genug das Warum und schlagen daher wenig wünschenswerte Lösungen vor. Solche Analysen sind nun mal komplex und sie fallen uns oft selbst nicht leicht. Daher ist beim Design eine gesunde Portion Selbstzweifel vonnöten.

Eines der vielleicht berühmtesten Beispiele für dieses Prinzip in Videospielen ist die Thompson der Alliierten in Wolfenstein: Enemy Territory, die gegenüber ihrem Pendant der Achsenmächte als überlegen wahrgenommen wurde. Forderungen nach einem Nerf wurden laut, obwohl das Spiel eigentlich symmetrisch war. Es wurden sogar Daten vorgelegt, die zeigten, dass Spieler damit bessere Leistungen erzielten. Am Ende fanden die Entwickler heraus, dass Teil des eigentlichen Problems der kräftigere Soundeffekt der Thompson war. Damit fühlte sich die Waffe stärker an, sodass Spieler selbstsicherer damit umgingen, wodurch automatisch ihre Performance stieg. Eine Anpassung der Soundeffekte löste das Problem fast vollständig.

So sehen wir auch in GWENT oft Lösungsvorschläge, die das Problem nicht an der Wurzel packen und manchmal sogar noch größere verursachen. Nachdem zum Beispiel Milva: Scharfschützin in 9.6 erschienen war, kam der gängige Vorschlag auf, sie durch Hingabe einzuschränken. Dieser Ansatz warf gleich mehrere Probleme auf, denn er bezog sich nur auf ein paar der Decks, in denen die Karte zum Einsatz kam (und zwar nicht einmal die stärksten), schränkte damit deutlich die Vielfalt von Decks ein, in denen die Karte zum Einsatz kommen könnte (was nie unser Ziel gewesen war), und ließ die Wahrnehmung durch Gegner außer Acht. Diese sehen nämlich oft einfach nur eine starke Karte und nicht, was man für die Hingabe-Bedingung aufgeben musste (ein Thema, das wir ein andermal beleuchten werden).


Weitere Beispiele sind die Vorschläge, die Wilde Jagd, die Zwerge oder Zusammenkommen mit besseren Möglichkeiten zur Spielfeldkontrolle auszustatten, oder allen Fraktionen "Läutern" zu verpassen. Während sie kurzfristig sicherlich den Archetypen helfen könnten, halten wir es für sehr wichtig, die Identitäten der Fraktionen/Archetypen zu bewahren, indem wir ihnen verschiedene Schwächen und damit Spielweisen geben, die wiederum durch angemessene Stärken ausgeglichen werden. Die Vergangenheit zeigt, dass wir dahingehend nicht immer die besten Entscheidungen getroffen haben. Ältere Designs nutzten oft dieselben Muster für unterschiedliche Fraktionen, sodass sie alle Zugriff auf ähnliche Methoden hatten. Aber wir arbeiten konstant daran, denn wir glauben, das Spiel wird mit einem breiteren Angebot an Deckidentitäten interessanter. Allerdings wird dadurch der Aufbau eines Archetyps schwieriger, und wir müssen damit rechnen, seine Identität mehrfach anzupassen.

Diese und die genannten Design-Prinzipien erklären hoffentlich, warum wir nicht immer den direkten Weg nehmen, wenn es ums Balancing einer Karte geht. Bei all den unterschiedlichen und widersprüchlichen Meinungen müssen wir herausfinden, wann und wie wir Änderungen durchführen, und wann wir unserer eigenen Ansicht trauen sollten, um das Spiel so gut wie möglich zu gestalten.