뜨거운 감자인 밸런스 조정, '정답'이 있을까?

게임뉴스 | 양영석 기자 | 댓글: 4개 |



  • 주제: PvP 게임에서 배울 수 있는 작은 것들
  • 강연자 : 하라다 카츠히로 / Chief Producer, Bandai Namco Studios Inc.
  • 발표분야 : 운영, 밸런싱
  • 강연시간 : 2022.11.18(금) 14:00 ~ 14:50
  • 강연 요약: 지난 28년간 철권을 개발/운영 하며, 많은 게임 내 통계 데이터를 통해 볼 수 있던 ‘게임 밸런스’라 불리우는 것이란? 그 이상과 현실에 대해 이야기 합니다. 또한, 캐릭터를 만드는 방법 등에 대해서도 이야기 합니다.




  • 경쟁형 게임을 즐기는 게이머들이라면 대부분 그런 생각을 해봤을 것이다 '내가 개발자라면 더 밸런스 조정을 잘 할 텐데'라는 말이다. 개발자들이 겜알못이네 하는 이야기도 했을 수 있다. 그만큼 현재의 게임 밸런스 환경에 대해 불만이 있고 애정이 있으니 나오는 말이기도 하고. 역으로 게임을 개발하는 개발자들도, '밸런스를 좀 더 좋게 잡아라'라는 의견도 많이 들을 수밖에 없다.

    28년의 역사를 이어오며 전 세계에서 가장 인기 있는 대전 격투 게임인 '철권'도 여기서 자유로울 수는 없었다. 그리고 그동안의 철권 시리즈와 그 외의 게임을 많이 맡은 하라다 카츠히로 프로듀서는 여기서 좀 더 근본적인 질문을 제시했다. '대전 게임에서 캐릭터 밸런스 조정 방법에 정답이 있나?'라는 질문, 그리고 그러한 밸런스와 게임의 재미가 어떤 상관관계를 갖고 있느냐는 것이다.




    우선 하라다 프로듀서는 철권 28년의 역사를 짚어보며 '어떤 상황'에서 밸런싱을 했는지를 조명했다. 철권1~3의 초창기는 한국을 포함해 유럽, 북미 등에서도 '아케이드' 시장이 전성기를 맞이한 때다. 물론 당시 게임 밸런싱은 대부분 디자이너들이 '이러면 좋겠지'라는 태도로, 감각적으로 만든 경향이 많다. 그래서 꼼수에 가까운 무한 콤보나, 치명적 버그에 대해서는 세상 모든 아케이드 기기의 보드 롬을 교체하는 방법밖에 없었다. 그럼에도 유저들은 그 불편함을 받아들였기에 오히려 불만이 없던 시기라고 볼 수 있었다. 인터넷이 있긴 했지만, 보급이 적었고, 그래서 게임 내에서 통계적 데이터를 잘 확보할 수가 없는 시대였다.

    1990년부터 2005년, 철권 태그 토너먼트와 철권5까지의 시기에서는 좀 환경이 변화됐다. 인터넷도 많이 보급됐지만, 여전히 아케이드 시장이 온라인으로 넘어가지는 않았다. 인터넷 시대에 접어들었지만, 아케이드에서는 제대로 된 데이터 수집이 힘들었고, 가정용 게임기 한정으로는 데이터 수집이 가능해졌다. 그리고 2005년 이후부터는, 대전 게임 역시 완전히 온라인 시대로 바뀌면서 모든 타이틀에서 데이터 수집이 가능해진 시기에 도달했다.

    데이터 수집이 용이해지고 분석이 되는 만큼, 통계 데이터를 기반으로 하는 게임의 튜닝이 가능해진 시대. 그렇지만 통계 데이터를 기반으로 한 게임 튜닝이 반드시 옳은 일일까? 90년대부터 하라다 프로듀서는 통계 데이터를 통해 과학적으로 분석하여 게임을 튜닝할 수 있지 않을까 하는 생각을 했었다고 한다.

    언뜻보면 통계 데이터를 기반으로 한 게임 튜닝은 공평하고 과학적인 방식으로 '보인다'. 빅데이터를 활용한 통계데이터는 일반 사회생활에서 개개인의 관점으로 알아채지 못한 사실도 밝혀내기에, 매우 신뢰성이 있는 자료라고 생각할 수 있다. 그렇지만 이게 대전 게임의 데이터에 적용되는 건 다른 문제다.




    여기서 '대전 게임의 밸런스'가 좋다는 의견을 돌아볼 필요가 있는데, 대체적으로는 세 가지 정도로 압축된다고 한다. ▲각 캐릭터의 강함이 균형이 잡힌 상태, ▲캐릭터들의 장단점은 있어도 극단적으로 강하거나 약한 캐릭터는 존재하지 않는 상태, ▲불평등이라고 느끼지 않는, 공평하다고 생각되는 상태. 이렇게 3가지가 주로 언급된다.

    다만 이러한 견해들은 큰 맹점이 있다. 공평하고 평등한 게임들은 일반적으로 '유저의 실력이 동등하다'는 전제가 있거나 '캐릭터 성능을 극한으로 끌어내는 사람들의 대전'을 전제로 삼기 쉽다. 실질적으로는 플레이어의 그룹을 나눠서 조사를 해보면 밸런스를 올바르게 평가하기가 어렵다. 초보, 중수, 고수의 영역에서 느끼는 캐릭터의 강함이나 밸런스가 다르기 때문이다.

    인터넷 시대가 도래하면서 이러한 의견에 약간 변화가 생긴 변화이기도 하다. 비슷한 실력을 갖춘 유저들의 대전, 그리고 캐릭터 성능을 무한으로 끌어낸 사람의 대전을 전제로 밸런스를 판단해버리기 쉽게 됐다. 또한, 유명한 플레이어끼리 대전을 했을때 얼마나 밸런스를 갖추고 있느냐고 보면 '최대 성능'을 토대로 캐릭터 랭킹 리스트, 일종의 '티어리스트'가 만들어지고 공유된다.




    하라다 프로듀서는 이러한 경향을 '한계 성능 이론값 가설'이라고 칭하면서, 실제 통계와는 차이를 보인다는 점을 설명했다. 이러한 '한계 성능 이론값 가설'에 근거한 밸런스는, 가장 많은 플레이어층이 있는 초급~중급 자가 일상에서 보고 있는 승패 누적 데이터와는 큰 차이가 난다.

    그렇게 가장 많은 사람이 경험하는, 가장 많이 승리한 캐릭터가 티어 리스트로 만들어진 상위의 캐릭터가 아니라는 현상이 발생한다. 가장 많이 이기고 있는 것은 캐릭터 랭킹 상위가 아닌 캐릭터라는 사실과의 차이를 알아채는 사람이 거의 없거나, 있어도 언급되는 일이 없어진다. 특히 이러한 경향은 인터넷 커뮤니티가 확립된 현대에 두드러진다.

    이는 정보 사회가 가져오는 견해의 획일화 현상이라고 볼 수 있는데, 이에 대해서 하라다 프로듀서는 대규모 토너먼트의 스트리밍, 프로 플레이어의 영향력, 그리고 스트리머의 확산력으로 생성하는 정보와 견해의 획일화가 '한계 성능 이론값 가설'을 가속화시킨다고 언급했다.

    결국 이러한 현상 속에서는 대규모 토너먼트 16강에 진출한 플레이어의 캐릭터 선택에 치우치지 않는 경우, 커뮤니티는 밸런스가 좋은 상태라고 평가하는 경우가 잦다. 결국 통계 데이터에 따른 대다수의 플레이어게 정말고 일어나는 일을 기준으로 튜닝하는 것보다도 토너먼트와 같은 드물고 특수한 환경에서 일어난 일을 기준으로 튜닝하는 편이 평가를 얻기 쉽다는 의미다. 이것은 마케팅용 SNS 분석 툴 등의 결과를 봐도 측정이 되고 명백한 경향이라고.

    물론 당연하지만 이런 이야기 이전에 명백한 개발 측의 실수 때문에 잘못된 사례도 일어난다. 하라다 프로듀서도 최악의 악몽은 초급-중급-상급자 플레이어층과 관계없이 "실력과 관계없이 다루기 쉽거나 흉악하게 강력한 밸런스 붕괴 캐릭터'를 만들어 버리는 실수를 언급하며, 개발자들은 솔직하게 미안하다고 밖에 말할 수 없다고 했다. 그렇게 하라다 프로듀서도 공식 석상에서 사과했다.







    다시 돌아와서, 하라다 프로듀서는 플레이어가 말하는 '대전 게임에서 좋은 게임 밸런스'라는 게 무엇인가에 대한 근본적 질문을 다시 던졌다. 플레이어들의 견해는 조사 결과에 의하면, 대체로 아래와 같은 결과로 나타난다. 균형, 공평, 불평등하지 않다는 키워드가 게임 밸런스의 인상을 좌우하는 것이다.

    ▲ 각 캐릭터의 강함이 균형이 잡힌 상태(거의 모든 캐릭터가 활약할 수 있는 상태)
    ▲ 캐릭터에 일장일단은 있어도 극단적으로 강하거나 약한 캐릭터가 없는 상태
    ▲ 불평등이라고 느끼지 않는, 공평하다고 생각되는 상태

    그렇지만 PvP, 굳이 따지자면 격투 게임에서 캐릭터 성능이 좋은 밸런스일때 그것이 '재미있다'고 느껴질 수 있을까? 액션 게임에서 PvP는 장기 및 체스에 비해 공평함과 재미가 양립할 수 있는 목표가 될 수 있을까? 하라다 프로듀서는 이 부분이 정말 어려운 부분이라고 강조했다.

    여러 테스트와 시도를 통해서, 하라다 프로듀서는 공평성과 재미는 상반되는 속성을 갖고 있다고 전했다. 예를 들어 철권에 오직 '쿠마'만이 있다면, 밸런스와 공평함이 완벽하다. 여기서 캐릭터를 얹고, 기술 프레임이나 대미지, 애니메이션과 외형이 달라지는 과정에서 게임에 '개성'이 생겨나고 더 재밌어진다. 그렇지만 이 과정 자체가 불공정함이 조금씩 상승하고, 결과적으로는 밸런스가 붕괴되는 결과가 나온다.

    그럼에도 불구하고 캐릭터들이 '개성'화가 진행되면 밸런스가 붕괴하더라도 재미와 즐거움의 곡선이 같이 상승하는 효과가 나온다는 것이다. 그렇지만 부작용도 있다. 점차 게임이 개성을 띄고 재밌어지더라도 어려움과 진입 장벽도 올라간다. 그렇기에 아래의 속성을 띄게 된다. 결과적으로 본래의 이상적인 모습은 아래와 같다.

    ▲ 각 캐릭터에 각각 다른 강한 개성이 있고
    ▲ 캐릭터끼리의 상성은 있지만 분석하기에 따라 어떻게든 되는 범위이기도 하며
    ▲ 토너먼트 및 프로끼리의 대전에서도 캐릭터 선택의 폭이 넓고 치열한 전투가 되는 것
    ▲ +그러면서도 초보자 진입 장벽이 없다(혹은 장벽이 낮다)




    이상론으로는 이렇게 정리할 수 있다. 그렇지만 이런 이상론의 항목을 모두 만족하게 하면서 심도 있고, 몇십 년이나 길게 사랑받는 게임을 만드는 일은 정말 어렵다고 강조했다.

    그래서 결과적으로 대전 게임에서 캐릭터 밸런스 조정 방법에 정답이 있을까? 그 가설을 실증하기 위한 수법과 있고 과거에는 통계치에 기반한 튜닝이 인한 효과가 있었지만, 결국 하라다 프로듀서는 시대 배경의 변화에 따라서 상기 가설은 적절한 답이 아니라는 것을 실감하게 됐다.

    세계적인 격투 게임 대회 EVO 16강에 진출한 선수와 대전하는 일 자체는 일반적인 게이머에게 많지 않은 일이고 실제로 일어나지 않는 경험이라고 볼 수 있다. 그렇지만 현 주소에서 유저들은 이론의 한계 성능 값으로 보고, 모든 성능을 끌어낸다는 가설을 토대로 이야기하면서 최강을 논하고 밸런스를 이야기하는 일이 현주소다.

    그는 이런 현상이 나쁘다는 게 아니라, 그것이 현실이라고 다시 한 번 강조했다. 이는 가장 플레이 층이 많은 스킬 레벨에서 끌어낸 통계치로 게임을 튜닝하는 것이 아니라, e스포츠 대회 등을 고려하여 결과로 보이기 쉬운 튜닝을 실시하는 밸런싱이 비교적 높은 평가를 얻을 수 있음을 뜻한다. 물론 앞으로는 AI라던가 좋은 분석을 하는 새로운 판단 법이 나올 수도 있다. 이론을 쌓아도 마지막은 감정으로 판단하는 존재가 인간이며, PvP 게임 개발자는 '항상 시대에 맞는 감정론'을 주시할 필요가 있다고 전하며 강연을 마쳤다.







    Q. 철권 7부터 시작한 유저다. 철권8에서도 녹티스를 볼 수 있나?

    =못 들었다고 하고 넘기려고 했는데 통역 성능이 너무 좋다. 특정 캐릭터가 또 나오는 걸 바라는 분이 계시면 온라인에서도 목소리를 내주시면 대응할 수 있을 것 같다. 기왕이면 반다인남코 본사 앞에서 농성을 해주시면 될 것 같다(웃음).


    Q. 완벽한 게임 밸런싱은 불가능에 가깝다고 생각하겠지만, 특정 게임은 캐릭터성을 살리려고 일부러 밸런싱을 파괴하는 때도 있었다. 개성이 드러나지만 밸런스를 맞춰야 한다는 의견인지, 의도적으로 밸런싱 파괴를 해도 캐릭터성을 살리는 지 본인은 어떤 입장인지 알고 싶다.

    =아주 좋은 질문이다. 개인적으로 캐릭터의 개성은 반드시 남겨야 한다고 생각한다. 그렇지만 이 개성과 게임의 즐거움, 관계성은 아주 어려운 관계다. 개성을 드러내는 게 인상도 깊게 남고 재밌게 플레이할 수 있으며 우리도 중시하는 요소다. 업데이트 과정에서 개성을 줄이고 밸런스를 추후 맞춰가는 게 게임 전체적으로 보면 좋다고 본다. 서비스를 막 시작한 시기와 중후반에 중점을 둬야 하는 게 다른 것 같고, 평가들도 게임 서비스 시기에 따라 좀 달라지는 것 같다.


    Q. 반다이남코의 소울칼리버 등 다른 게임은 고수를 배틀디렉터로 고용하여 밸런싱을 하곤 하는데, 철권은 그럴 생각이 없나?

    =철권도 유명 플레이어 분, 혹은 유명하지는 않지만, 게임 센터에서 유명하시거나 지역 센터에서 유명한 분, 본인만의 이론적 밸런스를 갖고 있는 분들의 의견을 참고하고 있다. 소울 칼리버처럼 배틀 디렉터를 활용하거나 하는 건 같다. 해외에 계신 고수 플레이어들에게 먼저 테스트를 맡긴다든가 하는 활동도 하고 있다.


    Q. 철권 외에도 프로듀싱한 여러 게임이 있는데, 놀랐던 점이 재미가 있는데 유난히 특정 유저들이 긴 시간을 하는 걸 봐왔다. 그런 게임을 오래 하게 하는 비결 같은 게 있을까?

    =이걸 제가 쉽게 답변하면 다들 게임을 쉽게 만드실 수 있는 거라 답변드리기 어려운 질문이다. 게임 제작은 종류가 많다. 코지마 프로듀서같이 작가성이 강한 게임을 만드는 사람도 있지만 저는 툴을 만드는 프로듀서에 가깝기 떄문에 작가성이 강하다고 하기 그렇다. 철권 스토리를 보고 좋다고, 감동 받아서 눈물을 흘리는 건 아니지 않나. 그런 부분이 강하지 않은 대신 플레이어들이 게임을 했을 때 너무 화가 나서 더 열심히 해보자, 혹은 오늘은 이겨서 보람을 느낀다던가 하는 부분? 플레이의 승패나 스타일에 따른 플레이어들의 분노, 괴로움, 즐거움을 다양하게 즐길 수 있도록 포커싱해서 끌어낼 수 있는 지가 중요하다고 생각한다.


    Q. 밸런싱을 할 때 평균적인 실력의 유저 기준과 성능 한계를 끝까지 내는 유저들의 기준, 이 중 어느 점에 중점을 두고 하는 게 좋다고 생각하나?

    =앞서도 말씀드린 것처럼 평균 쪽에서 잡는 게 좋은 시대도 있었다. 현재는 영향력이 있는 잘하는 유저, 유튜브나 실황 중계를 하면서 영향력이 있는 사람이 뭐라고 하느냐는 게 꽤 중요하다. 그런 부분에 맞추면 '평판'은 좋아진다. 감정적인 부분이 중요하다. 그리고 영향력이 있는 분들이 발언을 무시할 순 없다. 하지만 미래에는 어떻게 될지 모르겠다. 캡콤은 일부 시작을 했는데, 철권도 매일 데이터를 공개해도 되지 않나 하는 생각도 있긴 하다.


    Q. 밸런스 패치를 지금 해야 한다는 시점이 언제인지 어떻게 캐치를 하는가? 이건 문제가 있다 하는 판단을 언제쯤 내리고 패치 하는지 궁금하다.

    =구체적인 수식과 수는 기업 비밀이라 공개할 순 없다. 앞서 공개한 표에서 대충 보면 색이 변화를 한 부분이 있을텐데, 그 색이 변하면서 누적치가 있어야 통계가 된다. 업데이트해도 일주일 만에 답을 내리면 안 된다. 업데이트 후 2주에서 한 달 정도가 되면 엄청난 대전 데이터가 쌓인다. 그때는 다이어그램이 새빨간 경우(매우 낮은 승률)도 있고, 상성을 뚜렷하게 보이는 일도 있으며 반대로 시퍼런 경우(매우 높은 승률)도 있다.

    이때 '아, 이건 뭔가 있다'하고 인식을 하는 편이다. 온라인 유저들의 평판도 고려하고 있으며 그런 의견들이 지적하는 부분과 통계가 일치하는 부분이 있는데 그런 건 빨리 고쳐야 한다. 반대로 통계에는 특이한 게 보이는데, 유저들을 아무 말도 안 하는 경우도 있어서 왜 이리 불만이 없는가 하고 의문이 들 때도 있었다. 그래도 대략 1개월 정도가 지나면 어떠한 경향이 드러나므로, 그것으로 판단하는 편이다.

    댓글

    새로고침
    새로고침

    기사 목록

    1 2 3 4 5