
크래프톤은 현재 '크래프톤 AI'와 '루도 로보틱스' 두 가지 브랜드로 AI 연구 조직을 운영 중이며, 루도 로보틱스 명의로 대외 기술 공유에 나선 것은 이번이 처음이다. 이번 기술 공개는 상업적 사업 전개보다 개발자 간 오픈 소스 공유와 기술 발전을 위한 생태계 기여를 목적으로 한다.
이번에 공개한 기술은 크래프톤이 사내에서 활용 중인 인공지능 에이전트 시스템을 오픈소스 프로젝트 '키라(KIRA)'로 재단장한 것이다. 키라는 '크래프톤 인텔리전스 루키 에이전트'의 약자다. 임직원 1,800명 이상이 내부적으로 사용한 인공지능 시스템 '크리스'를 누구나 독립형 데스크톱 애플리케이션으로 설치할 수 있도록 가상 동료 개념으로 구현했다.
터미너스 키라는 터미널 벤치 테스트에서 최고 74.8%의 작업 달성률을 기록했다. 터미널 벤치는 AI가 컴퓨터 터미널 환경에서 인간을 대신해 코드를 작성하고 문제를 해결하는 능력을 평가하는 기준이다.
이전 시스템인 '터미너스 2'는 터미널 로그를 확인한 후 AI에게 확신 여부만 묻는 단순한 과정을 거쳤으나, 터미너스 키라는 기존 터미널 로그에 작업 설명과 자기 비판 프롬프트를 추가로 부여한다. AI가 스스로 작업 내역을 비판적으로 검토하고 오류를 수정하도록 유도해 최종 성공률을 높이는 원리다.

실제 성능 지표를 살펴보면 터미너스 키라는 여러 대형 언어 모델과 결합했을 때 기존 대비 뚜렷한 성능 향상을 입증했다. 제미나이 3.1 프로 씽킹 모델을 기반으로 구동했을 때 이전 세대인 터미너스 2는 68.5%의 성공률을 보였으나, 터미너스 키라는 74.8%로 6.3%P 상승했다. 오퍼스 4.6 모델 적용 시에도 62.9%에서 74.4%로 11.5%P 향상됐다. 제미나이 3.1 프로 일반 모델의 경우 52.4%에서 64.0%로 11.6%P 증가하며 전반적인 AI 문제 해결 능력이 개선된 것을 확인했다.
이강욱 본부장은 이번 연구를 통해 인공지능 모델이 인간을 완전히 대체하기보다 보조하는 역할에 최적화되어 있다는 점을 강조했다. 인공지능 모델이 아직 완벽하지 않다는 현실을 인정하고 이를 기술적으로 보완하는 방법을 제시한 것이다.
AI 기술로서는 막대한 자본을 투입해 독자적인 거대 모델을 구축하는 대신, 기존 상용 모델에 자기 비판 프롬프트를 도입해 비용 효율적으로 작업 성능을 끌어올렸다는 점이 특징이다. 이는 국내 게임사가 세계 오픈소스 개발 생태계에 실질적이고 가벼운 해결책을 무상으로 공유했다는 점에서 의의가 있다.




