궨트의 디자인 02: 밸런싱

궨트의 디자인에 대해 다루는 칼럼 시리즈에 오신 걸 환영합니다. 이 칼럼 시리즈에서는 궨트 디자인의 주요 개념과 디자인 철학, 그 밖의 적절한 주제에 대한 심층 분석을 정기적으로 공개할 예정입니다. 칼럼을 통해 보고 싶은 주제가 있다면 언제든 저희에게 말씀해 주세요!


초기 궨트부터, 경쟁 게임과의 주요 차이점 중 하나는 밸런스 패치를 진행하고 그 메커니즘을 발전시켜 나가겠다는 의지였습니다. 오늘은 게임과 커뮤니티의 분위기를 좌우하는 이 월간 밸런스 패치가 왜, 그리고 어떻게 진행되는지 자세히 알아보도록 하겠습니다.


우선, 조금 다른 얘기지만 "메타게임(metagame)"에 관한 이야기를 해야 할 것 같습니다. 아마 들어본 적이 있으시겠지만, 메타(META)는 "가능한 가장 효율적인 전략"의 약어입니다. 살짝 설명을 덧붙이자면, 사실 이 단어는 이미 존재하는 약어에 새로운 의미가 붙은 겁니다. 하지만 메타게임은 그리스어로 "너머"를 뜻하는 접두사인 "메타"가 붙은 거죠. 예를 들어, "메타게임 상호 작용"은 명시된 게임 규칙 밖에서 일어나는 상대와의 상호 작용을 뜻합니다. 상대를 방해하기 위해 트래시 토크를 하거나, 궨트에서 마지막 남은 한 장의 카드로 상대를 이길 수 없다는 걸 알면서도 상대가 항복하기를 바라며 감정 표현을 하는 것처럼 말이죠.

하지만 메타게임이라는 단어는 특정 기간이나 특정 커뮤니티에서 게임이 진행되는 방식을 나타내기 위해 단독으로 사용되는 경우가 더 많습니다. 전자는 이해하기 쉬우실 겁니다. 게임 자체가 변하지 않더라도, 시간이 지남에 따라 사람들이 새로운 전략과 더 나은 방법을 찾아 이전 전략에 적응하면서 게임이 진행되는 방식이 변하기 때문이죠.

후자의 경우는 실물 카드 게임을 생각해보면 될 겁니다. 카드 게임을 즐기려면 매주 동네 카드 가게를 찾아가야 하니까요. 거기에는 보통 10~20명 정도의 플레이어가 있을 겁니다. 그중 절반 이상을 차지하는 캐주얼 플레이어는 화려한 전략을 선호하고, 1/4은 승리를 우선시하겠죠. 나머지는 어떻게든 특정 덱을 사용해 보려고 하는 실험적인 플레이어일 겁니다. 이제 여러분은 지난 국제 토너먼트에 관한 인터넷 토론에서 파생된 "최적"의 덱을 사용할 수 있지만, 최고의 결과를 얻으려면 여러분이 처한 특정 환경에 적응해야 합니다. 조니가 리비아의 게롤트와 강력한 제거 카드를 너무 좋아하니 일부러 와이드 덱을 가져가는 것처럼 말이죠. "최적이 아닌" 전략을 사용하는 것이 특정 상황에서 실제로 최고의 결과를 가져오는 것을 두고 Frank Lantz는 “Donkey Space”라고 부릅니다.

중요한 건 인터넷으로 인해 규모가 커지고 경계가 사라져서(특히 자동 매치메이킹이 가능할 경우) 디지털 게임의 경우 이 효과가 약해지긴 했지만, 이러한 효과가 여전히 존재한다는 겁니다. 이것을 설명할 수 있는 가장 좋은 예 중 하나는 리그 오브 레전드의 첫 번째 국제 토너먼트입니다. 플레이하는 서버가 달랐기 때문에, 유럽과 미국의 커뮤니티는 서로 다른 메타게임을 발전시켜 왔습니다. 역할 분배도 다르고 선호하는 챔피언도 달랐죠. 이러한 초기 토너먼트를 통해 유럽의 방식의 우위를 점하게 되었고, 결국 이로 인해 지역 간 기준이 비슷해졌습니다. 하지만 애초에 같은 언어(영어)와 토론 공간(Reddit이나 게임 포럼 등)을 사용하는 두 커뮤니티가 전혀 다른 게임 플레이 방식을 보여줬다는 점은 여전히 매우 흥미로운 부분입니다.

또 다른 예는 신경망 인공 지능인 OpenAI가 DotA를 플레이하는 방식입니다. 역할에 따라 수익을 배분하는 우선순위가 다른 기존 MOBA 메타게임과 달리, OpenAI는 각 플레이어의 수익을 고르게 배분해 모든 캐릭터가 전투에서 효율을 발휘할 수 있도록 유동적이고 객관적인 방식으로 플레이했습니다. 이러한 결과는 AI가 놀라운 조직력과 발달 편향을 활용해 플레이어들이 오랜 시간에 걸쳐 쌓아 온 메타게임과 같은 것이 나타나지 않게 막은 것이라고 생각할 수 있지만, 그래도 의문은 존재합니다. AI가 이기고는 있지만, 그게 과연 게임을 플레이하는 올바른 방향이라고 할 수 있을까요? Starcraft II의 신경망 AI인 AlphaStar가 보여주었던 (효율성 저하를 감수하고 공격받았을 때 회복력을 높이기 위해) 본진에 일꾼을 과도하게 배치하는 방식도 결국 플레이어들에게 인정받게 되었죠.

여기서 제가 강조하고 싶은 메타게임의 주요 요소를 확인할 수 있습니다. 바로 플레이어의 주관에 달려 있다는 거죠. 메타게임은 플레이어의 인식, 플레이하는 상대, 소속 커뮤니티, 영향을 받은 플레이어, 원하는 플레이 방식 등 다양한 요소에 영향을 받아 구성됩니다. 물론 게임의 객관적인 상태도 영향을 끼치지만, 게임을 가장 잘하는 방법을 보여주는 건 언제나 메타게임일 겁니다. 인터넷을 이용하는 사람들도 생각보다 훨씬 더 분열되어 있습니다. 등급과 시간대, 습관이 다르기 때문에 상대하는 플레이어도 전혀 다를 수밖에 없죠. 언어적 장벽뿐만 아니라, 구독하는 스트리머나 토론 장소도 게임에 대한 의견에 큰 영향을 미칩니다. 메타 리포트가 좋은 예죠. 비슷한 성향의 커뮤니티에서도 덱 목록과 그에 따른 의견은 다를 때가 많습니다.


이처럼 긴 서론은 결국 "왜"라는 질문으로 귀결됩니다. 밸런스 패치는 게임을 더욱 재밌게 만들기 위한 것입니다. 그러려면 밸런스는 목적이 아니라 수단이 되어야 하죠.

일반적으로 밸런스를 조정하는 가장 쉬운 방법은 대칭을 이루는 것입니다. 모든 플레이어가 항상 동일한 조건에서 플레이할 수 있다면, 밸런스를 걱정할 필요가 없죠. 하지만 비대칭 게임 플레이의 인기는 서로 다른 조건에서 게임을 하더라도 다양한 선택지를 탐색하고 그로 인해 다시 플레이하게 된다는 점에서 재미를 느끼게 된다는 걸 보여줍니다.

또 다른 포인트는 밸런스가 반드시 게임 플레이에 관한 정보를 주진 않는다는 점입니다. 완벽하게 가위바위보 관계에 놓인 세 가지 덱이 메타를 이루고 있다고 생각해 보세요. 평균 승률만 보면 게임의 밸런스가 적절하다고 볼 수 있지만, 경기를 시작할 때부터 승패를 확실히 알고 있다면 게임 플레이가 매우 만족스럽지 못할 것입니다. 그래서 저희는 모든 경기의 극단적인 경우를 줄여 매 경기가 어느 정도 "공정"하게 느껴지도록 만들려고 합니다. 물론 전부 다 조정하려면 매우 힘들겠지만 말이죠. 그리고 공정한 경기라고 해서 무조건 게임 플레이가 만족스러운 건 아닙니다. 팽팽한 경기에서 패배하고 재미를 느낄 수 있는 것처럼, 경기 내내 휘둘린 느낌이라면 승리하더라도 불만족스러울 수 있죠. 일부 플레이어가 예전 버전 바이퍼 위쳐 연금술사(또는이 카드의 고르투어 그배드 활용)에 느꼈던 문제도 바로 이런 것이었습니다. 평균적으로 보면 그렇게 강한 카드는 아니었지만 제대로 당하면 좌절할 수밖에 없었기 때문이죠.

그래서 대부분의 경우 저희가 실제로 고민하는 것은 플레이어의 인식과 변경 사항이 인식에 어떤 영향을 미치는지입니다. 예를 들어, 데이터만 봤을 때는 엄청나게 좋지만 커뮤니티에서는 별로라고 느끼는 선택지가 있다고 가정해 봅시다. 이런 선택지를 너프하면 커뮤니티는 놀라며 의구심을 표할 것입니다. 사실 저희는 데이터와 플레이어의 강약 인식이 일치하지 않는 경우를 자주 발견합니다. 하지만 밸런스를 조정할 때 데이터를 이용하는 게 복잡하더라도 그만한 가치가 있죠.


게다가 밸런스 조정은 그 자체만으로는 명확하지 않습니다. 커뮤니티에서 불만이 나올 때마다 개발자가 개입한다면, 커뮤니티는 적응하지 못하고 현재 게임이 봉착한 문제의 해답을 찾을 기회를 잃게 되겠죠. 가끔은 어느 정도 시간을 주면 새로운 전략이 발견되고 이해도가 높아져서 특정 요소의 영향과 인식이 변하기도 합니다(이러한 관점에서 보면 가장 큰 실수는 8.2 패치에서 바이퍼 위쳐 스승을 버프한 것이었습니다. 패치의 최종 버전을 완성하고 적용하는 사이에 지연 시간이 있기 때문에, 해당 덱을 최종적으로 확인한 지 10일 후에 적용되었죠).

밸런스 패치가 최소한의 빈도로 진행되길 바라는 플레이어도 적지 않습니다. 특히 역사적으로 밸런스 패치가 매우 드물고 밸런스 패치로 인해 캐릭터의 느낌과 플레이 방법을 완전히 바뀔 수 있는 격투 게임 커뮤니티에서는 더욱 그렇죠. 물론 격투 게임과 카드 게임은 차이가 있지만요. 경험으로 미루어 볼 때, 보통 게임이 제공하는 게임 경험(플레이어의 선택에 따라 달라지는 게임 결과)이 다양할수록, 더 많은 플레이어가 게임에 적응할 수 있고 그에 따라 게임의 밸런스를 탐색하는 시간도 더 많이 필요합니다.

일반적으로 게임이 너무 빠르게 변하면 플레이어에게 압박이 될 수 있고, 너무 느리게 변하면 플레이어가 단조로움을 느낄 수 있습니다. 게다가 플레이어마다 이러한 속도에 대한 인식이 다르기 때문에 밸런스 조정은 언제나 어려운 과제입니다.


그렇게 우린 다음 주제에 도달하게 됩니다. 바로 커뮤니티가 단일 개체가 아니라는 것이죠. 하나의 커뮤니티에서는 대부분 극단적으로 반대하는 의견이 표출되기 때문에, 개발자들이 유일한 "진실"을 판단하기 어렵습니다(보통 그런 진실이 존재하지 않고 하나같이 매우 복잡 미묘하기 때문이죠). 커뮤니티에서 공감대가 형성된 것처럼 보여도, 커뮤니티가 실제로 그 의견에 얼마나 동의하는지 가늠하기 어려울 수 있습니다. 사람들은 주로 자신이 불만이 있는 사안에 목소리를 내기 마련입니다. 그래서 특정 사안에 대한 불만이 어느 정도 커뮤니티의 관점을 대변하거나 커뮤니티에 속한 다른 구성원의 인식에 영향을 미칠 수도 있지만, 대부분의 경우에는 딱히 문제가 없다고 생각하면서도 굳이 말할 필요가 없다고 느끼는 구성원도 있습니다. 이로 인해 밸런스에 관한 불만 사항을 해결하더라도, 재밌게 잘 플레이하던 것을 왜 바꾸냐며 불만을 품은 플레이어가 반대 의견을 제기하는 경우가 상당히 많습니다.

그러다 보면 의문이 생깁니다. 특정 덱이나 세력이 커뮤니티의 일부 구성원들에게 무시당하지만(안녕, 닐프가드!), 다른 구성원들은 이를 좋아하는 경우엔 어떻게 해야 할까요? 가끔은 답이 명확합니다. 지나치게 강력한 카드는 사용하는 게 재밌을지는 몰라도, 그것 때문에 전반적인 게임 양상이 망가지고 있다는 점에는 다들 동의할 겁니다. 하지만 다른 상황에서는 꽤 힘든 결정을 내려야 할 수도 있습니다. 특히 철학에서 종종 논의되는 것처럼 최고의 행복을 추구하려다 다들 조금씩 불만을 품게 될 수 있죠.


특정 덱이나 전략이 짜증 난다면, 그걸 사용하면서 즐거움을 느끼는 플레이어도 있을 거라는 점을 잊지 말아야 합니다. 그래서 저희는 지나친 너프는 지양하려고 합니다. 항상 그렇지만 너프를 하면 불만을 품는 플레이어가 생기는 건 물론이고, 덱 자체가 사장되어 게임의 다양성을 해칠 수도 있으니까요.

하지만 저희가 항상 적절한 너프에 성공하는 건 아닙니다. 특히 저희는 "너프 편향" 때문에 고통받는 경향이 있으니까요. 변화는 실제 상황보다 강하게 인식되기 때문에, 크게 너프된 카드가 여전히 꽤 좋은데 버려지기도 합니다(리그 오브 레전드에서는 캐릭터의 너프를 공지하고 실제로는 변경 사항을 적용하지 않았는데, 캐릭터의 플레이 비율과 승률이 내려가는 경우도 있었습니다). 플레이어가 이를 다시 실험하고 "재발견"하려면 시간이 필요할 수 있습니다. 예를 들어, 비이는 8.2 패치에서 너프된 후 사라졌지만 결국 2달 뒤에 다시 모습을 드러냈죠.

흥미롭게도 이와 반대되는 상황도 일어날 수 있습니다. 중요하지 않다고 인식되는 너프는 무시되는 경향이 있고, 승률이 떨어지더라도 실제 카드 플레이 비율에는 영향을 주지 않습니다. 유지비 변화는 이를 설명하는 좋은 예입니다. 특정 카드의 유지비가 오르면 "좀 더 저렴한 브론즈 카드를 쓰면 된다"라고 생각하며 무시하는 경향이 있습니다. 하지만 이로 인해 덱이 특정 상황에서 약해지게 되죠. 결국 전력이 몇 퍼센트 약해지는 셈인데, 50보다 5~6%만 높아도 매우 좋은 카드라고 여겨지는 상황에서 매우 큰 의미가 있습니다. 하지만 이러한 것은 통계일 뿐이고, 플레이어의 인식과는 별로 관련이 없습니다.

또한, 단 하나의 유지비 변화가 게임에 막대한 영향을 준 사례는 과거에 많이 있었습니다. 8.2 패치에서 버프된 막시 반 데카르는 전혀 쓸모없는 카드에서 경쟁력 있는 덱의 상징으로 변했고, 9.0 패치에서 너프된 에이스트 튀샤흐는 전사 덱에서 사장되고 말았습니다... 

잭팟도 꽤 흥미로운 사례입니다. 9.0 패치로 리워크된 잭팟은 16의 유지비 보너스를 지니고 있었고 세력의 대세 능력이었습니다. 그리고 9.1 패치에서 유지비가 1 너프됐을 땐 여전히 대세를 유지했지만, 9.2 패치에서 유지비가 2 너프된 뒤 보기 어려워졌죠... 그러다 9.4 패치에서 터널 드릴이 너프된 뒤 다시금 세력의 대세 능력이 되었습니다. 당시 힘의 대가가 신디케이트 세력에 꽤 큰 영향을 미쳤기 때문에, 이 리더 능력의 변화에 따른 인식의 변화를 제대로 확인할 수 있었습니다. 그럼 이제 다른 의문이 생깁니다. 잭팟이 유지비 보너스가 13이나 12인 상태로 출시되었다면, 플레이어들이 이 카드를 연구했을까요?

대규모 상호 연결 시스템 속에서 변화의 결과를 예측하는 것만 해도 어려운데, 플레이어의 인식까지 고려한다고 하면 더더욱 어려운 일이 될 겁니다.


작은 너프가 손쉽게 엄청난 인식의 변화를 일으킬 수 있지만, 버프의 경우엔 이와 정반대입니다. 덱이 너프될 때는 플레이어들이 그 덱이 얼마나 강한지 이미 알고 있기 때문에 너프가 어떤 영향을 미칠지 미리 생각해 볼 수 있습니다. 하지만 버프의 경우에는 사용되지 않거나 사용 빈도가 낮은 아키타입을 대상으로 하기 때문에 상대적으로 현재 상태를 알기 어렵죠. 특정 카드가 버프 후에 사용할 가치가 있는지 판단하려면 시간과 노력이 필요하기 때문에, 대부분의 플레이어는 버프가 큰 영향이 없다고 생각하면 굳이 신경 쓰지 않습니다.

이로 인해 최근에 저희는 버프의 방향을 아키타입 위주로 설정했습니다. 이러한 작업 방식은 저희가 더욱 야심 찬 변화를 제공할 수 있게 해줍니다. 가장 중요한 점은 이처럼 버프와 변경 사항을 묶어서 생각하면 더욱 재밌게 연습하고 실험할 수 있고 신선한 느낌을 받을 수 있다는 것입니다. 그리고 이로 인해 많은 플레이어가 해당 아키타입을 집중적으로 시험해 보게 되죠. 그러다 결국 너무 약한 덱이라는 생각이 들어도, 여전히 모두가 주시하는 덱으로 남을 겁니다. 그리고 저희는 차후에 이 덱을 개선하기 위해 사용할 수 있는 훌륭한 정보를 받을 수 있죠. 하지만 이러한 접근 방법은 해당 아키타입이 가장 재미있고 영향력이 큰 시기에 마땅히 제공해야 할 버프를 지연시키기도 합니다.


밸런스 조정과 플레이어의 인식에 관한 칼럼을 마무리하며, 플레이어의 인식에 관해 설명한 것이 무조건 커뮤니티가 "옳다"는 뜻은 아니라는 점을 말씀드리고 싶습니다. 이 칼럼을 통해 게임을 바라보는 커뮤니티의 인식이 어떤 식으로 편향될 수 있는지 여러 가지 예를 보여드렸지만, 여기서는 좀 더 넓은 범위의 디자인 원칙에 관해 이야기하고자 합니다. 플레이어는 자신이 느끼는 감정을 파악하는 데 매우 능숙하지만, 종종 그 이유를 잘못 파악하고 바람직하지 않은 해결책을 제시합니다. 이는 꽤 당연한 일입니다. 이런 종류의 분석은 복잡하고 저희 분석이 틀릴 수도 있기에, 디자인에서는 자신을 의심하는 게 중요하죠.

비디오 게임에서 이러한 원칙 중 가장 유명한 예 중 하나Wolfenstein: Enemy Territory에서 연합군의 톰슨이 추축군의 동등한 총기보다 좋은 것으로 인식되어 너프해야 한다는 의견이 제기됐던 사건일 겁니다. 성능이 완전히 동일한데도 말이죠. 심지어 데이터상으로도 플레이어들은 톰슨으로 더 좋은 성과를 내고 있었습니다. 결국 개발자들은 톰슨의 우렁찬 효과음이 문제의 원인이라는 것을 확인했습니다. 효과음 때문에 플레이어들은 톰슨이 더 강하다는 생각에 더욱 자신감 있게 플레이했고 결국 더 좋은 성과로 이어진 거였죠. 그래서 효과음을 조정했더니 대부분의 문제가 해결되었습니다.

이와 같이, 궨트에서도 당면한 문제를 해결하기에 불충분하거나 오히려 더 많은 문제를 유발하는 의견이 제기되곤 합니다. 예를 들어, 9.6 패치와 함께 출시된 밀바: 명사수의 경우, 헌신을 추가하라는 여론이 많았습니다. 이는 여러 문제를 야기할 수 있는 의견이었습니다. 카드가 포함된 덱 중 (무조건 가장 강한 것도 아닌) 일부 덱에만 적용되는 이야기인데다, (그런 의도로 만든 카드가 아니었는데도) 해당 카드가 포함될 수 있는 덱의 다양성을 큰 폭으로 제한하는 의견이었죠. 또한, 헌신 조건이 플레이어들에게 무시당하는 경향이 있다는 점은 지적하지 않았습니다(나중에 이 주제도 한번 살펴보죠).

또 다른 예로, 와일드 헌트, 드워프, 또는 결집에 더 나은 제어 수단을 추가하자는 의견도 있었습니다. 모든 세력에 정화를 추가하자는 의견도 있었고요... 이러한 변화가 단기적으로는 아키타입에 도움이 될 수도 있을 겁니다. 하지만 저희는 적절한 강점과 다양한 약점, 플레이 방법을 부여함으로써 서로 균형을 이루며 세력과 아키타입이 독자적인 정체성을 유지하는 게 매우 중요하다고 생각합니다. 과거를 돌아보면 저희가 부족했던 때도 있었습니다. 예전 디자인에서는 종종 모든 세력이 비슷한 도구를 사용할 수 있게 했지만, 이 또한 다양한 덱 정체성으로 게임을 재밌게 만들기 위해 연구한 것이었습니다. 이로 인해 적절한 아키타입을 설정하는 게 더욱 어려워지고 아키타입의 정체성에 대해 더욱 많이 고민해야 했지만 말이죠.


이러한 방향성과 이 칼럼에서 설명한 디자인 원칙을 고려해 보면, 저희가 왜 직접적으로 카드의 밸런스를 조정하지 않는지 이해할 수 있으실 겁니다. 상반되는 다양한 의견 사이에서 저희는 최고의 게임을 만들기 위해 언제(그리고 어떻게) 변화를 주고, 언제 저희 의견이 옳다고 믿어야 할지 판단해야 하기 때문입니다.


공유:

뉴스 더 보기

11.9 패치 노트

2023년 9월 11일

11.7 패치 노트

2023년 7월 12일

11.6 패치 노트

2023년 6월 6일

11.5 패치 노트

2023년 5월 11일