넥슨, 구글과 '유해이미지' 탐지 AI를 만들다

게임뉴스 | 정재훈 기자 | 댓글: 4개 |



2024년 4월 30일, 서울 JW메리어트 호텔 그랜드볼룸에서 진행된 '게이밍 온 구글 클라우드'에서 넥슨코리아의 윤준호 AI 엔지니어가 AI를 활용해 게임 내 유해이미지를 탐지하는 솔루션을 개발한 과정에 대해 발표했다.

온라인 게임에 UCC가 결합하기 시작할 무렵부터, 게임 속에 노출되는 다양한 유해 이미지는 언제나 게임 개발사의 골머리를 앓게 하는 문제였다. 모든 게이머들이 문제 없는 이미지만을 만들어내진 않았기 때문이다. 몇몇 게임의 경우, 이모티콘이나 의상, 깃발, 혹은 게임 내 구현된 배의 돛 등에 유저가 직접 만든 이미지를 삽입할 수 있었는데, 음란한 이미지나 정치적 의도, 혹은 차별과 비하의 의미를 담은 이미지를 삽입하는 경우가 왕왕 발생해 상당한 문제가 생기기도 했다.




문제는, 이를 막아내는 것이 쉽지 않다는 것. 만들어지는 UCC의 수는 게임에 따라 다르지만, 관리 인력이 일일이 잡아낼 만큼은 절대 아니다. 인력을 늘리자니, 관리 비용이 너무 늘어 배보다 배꼽이 더 커질 수도 있다. 결국, 답은 하나로 귀결된다. 자동화. AI를 활용하는 것이다.

윤준호 엔지니어는 이 단계에서의 문제를 말했다. AI 솔루션은 여러 가지이며, 각각 장점과 단점이 두드러진다는 것. 예를 들어 구글의 음란물 차단 솔루션인 '세이프서치'의 경우 실사 이미지 탐지에는 강점을 보이지만, 애니메이션이나 게임 등 만들어진 이미지는 비교적 효율이 떨어진다. 더구나 UCC의 경우 은유나 비유, 등 AI가 미처 찾아내지 못할 상징을 활용하는 경우도 상당하기 때문에 더 어려워진다.

이에, 넥슨은 구글의 새로운 AI 솔루션인 'Vertex AI'와 협업을 통해 해답을 찾아나갔다. 12주 간의 협업 과정 동안 머신 러닝을 활용하거나, 오픈데이터 활용, 임베딩 모델 등을 활용하며 12번의 실험을 진행했고, 이중 9번은 실패했지만 세 번의 부분적 성과를 얻었다.




머신러닝을 통해 실사와 인위적 이미지를 먼저 구분하고, 실사는 세이프서치로, 인위적 이미지는 이에 특화된 오토머신러닝-2를 활용해 검증하며 이 과정에 오픈 데이터셋을 활용하는 방법은 구조적 복잡성을 증가시켰지만, 게임이나 애니메이션 이미지에 대한 탐지 성능을 큰 폭으로 늘렸다.

'EfficientNet-B7'을 활용해 임베딩 벡터를 만들어 이미지를 숫자로 치환해 구분하는 방법은 임베딩에 대한 가능성을 활용했지만, 모든 경우의 수를 소화해내기엔 부족했다. VLM(Vision Language Model)을 활용한 실험 또한 VLM의 가능성 일부는 확인할 수 있었으나, 일반화하기엔 성능이 모자랐으며 너무 높은 연산 비용을 요구했다.

그리고, 넥슨과 구글은 이 모든 요소를 융합한 커스텀 모델을 만들어냈다. 12번의 실험 중 부분적으로 성공한 세 모델에서, 각각 쓸 수 있는 부분을 찾아내 합쳐낸 것. 이를 통해 넥슨은 전체 이미지 중 93%에 가까운 유해 이미지 탐지율을 보이면서도 라이브 서비스 비용을 81% 절감하고, 동시에 서버 레이턴시도 73.8% 줄이는 솔루션을 만들어낼 수 있었다.




윤준호 연구원은 해당 솔루션을 꾸준히 개량해 다른 개발사의 게임에서도 활용할 수 있는 오픈 솔루션으로 활용하는 방안을 고려 중이라 말하며, 동시에 구글과도 새로운 AI 프로젝트 협업을 논의 중이라 덧붙이며, 발표를 마쳤다.

댓글

새로고침
새로고침

기사 목록

1 2 3 4 5