"AI가 스스로 똑똑해지기 시작했다" 앤트로픽의 경고

커뮤니티메뉴

홈
웹진

"AI가 스스로 똑똑해지기 시작했다" 앤트로픽의 경고

기획기사 | 기자: 김병호 기자 | 댓글: 1개 | 11:37

AI 챗봇 '클로드'를 만드는 미국 기업 앤트로픽(Anthropic)이 2026년 6월 4일 보고서 한 편을 공개했다. 제목부터 직설적이다. "When AI builds itself(AI가 스스로를 만들 때)." 회사 산하 연구조직인 앤트로픽 인스티튜트가 펴낸 글로, 주장은 한 줄로 압축된다. AI 개발이라는 일을 AI가 점점 더 많이 떠맡고 있고, 그 변화가 이미 AI의 발전 속도를 끌어올리고 있다는 것이다.

중심 개념은 재귀적 자기개선(recursive self-improvement)이다. AI가 '다음 세대 AI'를 직접 설계하고, 그렇게 태어난 더 똑똑한 AI가 또 그다음 AI를 만든다. 스스로가 자신을 개선하면서 발전하고 있다는 말이다. 세대가 거듭될수록 발전 속도 자체도 빨라진다. 앤트로픽은 충분한 연산 자원만 주어지면 이 흐름이 결국 AI가 자기 후계자를 완전히 자율적으로 설계하고 개발하는 지점에 닿는다고 봤다.

물론 선은 분명히 그었다. 아직 그 단계에 도달하지 않았다고. 그리고 자신들이 강조한 '재귀적 자기개선'이 반드시 온다는 뜻도 아니라고 했다. 그러면서도 경고했다. 대부분의 기관이 준비를 마치기도 전에 예상보다 빨리 닥칠 수 있다는 것이다. 앤트로픽은 이 글을 통해 "우리가 운전대를 영원히 잡을 수 없게 되기 전에 미리 대비하자"는 이야기를 하고 있다.

"우리 회사의 코드 80%는 이제 AI가 쓴다"

이번 보고서에서 눈길을 끄는 건 앤트로픽이 그동안 감춰온 내부 숫자를 직접 꺼냈다는 점이다. 가장 놀라운 수치부터 보면 2026년 5월 기준, 앤트로픽 코드 저장소에 들어가는 코드의 80% 이상을 클로드가 작성한다. 코딩 도구 '클로드 코드'가 연구용으로 처음 나온 2025년 2월만 해도 이 비율은 한 자릿수 초반에 그쳤다. 불과, 1년 4개월 만에 생긴 변화다. 앤트로픽은 스크립트와 실험용 코드까지 더하면 90%를 넘는 것으로 추정하지만, 80%는 더 보수적으로 잡은 수치라고 설명했다.

생산성 지표도 가파르게 올랐다. 2026년 2분기 엔지니어 한 명이 넣는 코드 양은 4년 전보다 8배 많아졌다. 다만 앤트로픽은 코드 줄 수가 양만 잴 뿐 질은 못 재는 불완전한 지표라고 인정했다. 8배라는 숫자도 실제 생산성 향상을 거의 확실히 부풀린 것이라고 스스로 단서를 달았다. 그럼에도 흐름 자체는 부정하지 않는다. 코드 줄 수로 직원을 평가하지도 않는데 코드가 이만큼 늘어난 건, 그만큼 클로드에게 맡긴 일이 많아졌다는 뜻이라는 설명이다.

더 주목할 대목은 작업의 길이다. AI가 혼자 처리하는 작업 시간이 약 4개월마다 두 배로 늘고 있다. 외부 평가기관 메트르(METR)의 측정을 보면, 2024년 3월 'Opus 3'는 사람이 4분 걸리는 작업을 혼자 할 수 있었다. 1년 뒤 'Sonnet 3.7'은 1시간 30분이 걸리는 작업을 혼자 했다 다시 1년 뒤 'Opus 4.6'은 12시간짜리 작업을 혼자 처리했다. 앤트로픽은 "이 추세가 이어지면 짧은 심부름을 맡기던 단계에서, 며칠짜리 프로젝트를 통째로 넘기는 단계로 넘어가게 된다"라고 전했다.

"인간은 판단 능력서 우위" 그런데 그마저도 흔들린다

그렇다고 AI가 AI를 통째로 만든다는 얘기는 아니다. 첨단 모델을 만드는 일은 크게 둘로 나뉜다. 코드를 짜고 학습을 돌리는 '실행'과, 무엇을 시도할지 정하고 결과를 해석하는 '판단'이다. 앤트로픽은 둘 중 실행은 AI가 거의 따라잡았지만, 무엇을 만들 가치가 있는지 가려내는 판단력, 이른바 '연구적 감각'은 아직 사람이 앞선다고 본다. 문제는 그 마지막 영역마저 흔들리는 신호가 보인다는 것이다.

먼저 실행 영역을 보자. AI가 여기서 얼마나 빨라졌는지 보여주는 단골 실험이 있다. 앤트로픽은 새 모델이 나올 때마다 똑같은 코드 한 덩어리를 주고 "결과는 그대로 두되 더 빠르게 돌아가게 고쳐보라"고 시킨다. 점수는 원래 코드보다 몇 배 빨라졌느냐로 매긴다. 2025년 5월 'Opus 4'는 약 3배 빠르게 만들었다. 그런데 1년 뒤인 2026년 4월 '마이토스 프리뷰(Mythos Preview)'는 약 52배까지 끌어올렸다. 같은 문제를 숙련된 사람이 풀면 네다섯 시간을 들여 4배쯤 내는 게 보통이다. 사람을 한참 밑돌던 AI가 1년 만에 사람을 멀찍이 앞질렀다.

진짜 관심사는 사람의 영역이라던 '판단'이다. 여기서도 추격 신호가 잡힌다. 2026년 4월 앤트로픽은 클로드 기반 AI에게 안전 연구 과제 하나를 통째로 맡긴 결과를 공개했다. 가설을 세우고, 실험을 돌리고, 결과를 보고 다음 실험을 정하는 일까지 AI가 스스로 했다. 사람 연구자 두 명이 일주일을 매달려 목표의 23%까지 도달한 문제를, AI 여러 대는 누적 800시간과 약 1만8천 달러어치 연산을 쏟아 97%까지 풀어냈다. 다만 어떤 문제를 풀지 고르고 채점 기준을 세운 건 여전히 사람이었고, 이 성과가 실제 대형 모델에서도 똑같이 재현되지는 않았다는 단서가 붙는다.

또 다른 실험은 더 미묘한 능력을 건드린다. 연구가 막혔을 때 "그래서 다음에 뭘 해야 하나"를 고르는 감각이다. 앤트로픽은 연구자가 실제로 헛다리를 짚었던 순간 129개를 추려, AI에게 그 직전 상황만 보여주고 다음 수를 물었다. 사람보다 나은 방법을 찾은 비율이 2025년 11월 'Opus 4.5'는 51%, 반년 뒤 '마이토스 프리뷰'는 64%로 올랐다.

앤트로픽은 일부러 사람이 헤맨 장면만 골랐으니 공정한 맞대결은 아니라고 선을 그으면서도, AI가 연구의 갈림길에서 점점 더 나은 선택을 한다는 초기 신호로 읽었다. 코드의 질을 보는 시선도 비슷하다. 앤트로픽 사내에서는 클로드가 쓴 코드가 2025년 말까지만 해도 사람보다 못했지만 지금은 엇비슷하고, 1년 안에 더 나아질 것이라는 예상이 지배적이다.

앤트로픽이 말하는 미래, 그리고 다함께 멈추자는 제안

AI가 스스로 똑똑해질 때, 우리에겐 어떤 미래가 올까. 앤트로픽은 세 가지 미래를 내다본다.

첫째, 성장이 멈추는 길이다. 지금의 가파른 상승 곡선이 어느 순간 꺾이는 시나리오다. 다만 앤트로픽은 지금껏 측정한 능력 가운데 꺾인 것이 하나도 없다며, 이 가능성은 낮게 봤다.

둘째, AI 개발은 자동화되지만 방향키는 인간이 쥐는 길이다. 보고서가 가장 유력하게 보는 미래로, 100명짜리 회사가 수만 명 조직만큼 일을 해내는 세상이다. 문제는 같은 힘이 다르게 쓰일 수도 있다는 점이다. 예를 들어, 전 국민을 감시하거나, 개인마다 다른 여론 조작을 퍼뜨리는 데도 그대로 동원될 수 있다.

셋째, AI가 마침내 자기 후계자를 스스로 설계하고 만들어내는 길이다. 인간은 직접 개발에서 손을 떼고 감독과 검증만 맡는다. 그런데 사람이 개발에서 손을 떼고 뒤로 물러난 상태에서 AI가 엉뚱한 방향으로 나아가면, 그걸 바로잡을 수가 없다. 그래서 이 시나리오에서는 AI가 인간의 의도와 안전 목표에 맞게 행동하도록 길들이는 게 중요하다. 앤트로픽은 이걸 잘할 자신이 없다고 말한다. 최악의 경우, 지금은 드물게 나타나는 AI의 어긋난 행동이 후계자에서 후계자로 대물림되며 조금씩 커지고, 끝내 인간이 손쓸 수 없는 지경에 이를 수 있다.

그렇다면 어떻게 해야 하나. 앤트로픽은 AI를 만드는 회사라면 필요할 때 스스로 개발 속도를 늦추거나 잠시 멈출 수 있는 장치를 미리 마련해둬야 한다고 말한다. 하지만 한 회사만 멈추면 그 틈에 다른 경쟁자가 앞서갈 수 있다. 그래서 진짜 관건은 전 세계가 '서로 정말 멈췄는지 확인할 수 있는 방식으로' 다 함께 멈추는 것이라고 강조한다.

앤트로픽은 다만 다같이 멈추는 브레이크를 만드는 게 핵무기 통제보다 어렵다고 봤다. 핵개발과 달리 AI 학습은 미사일 격납고처럼 위성으로 잡아낼 수가 없고, 들어가는 재료라곤 어디에나 있는 연산 자원뿐이다. 게다가 남몰래 계속하면 선두를 독차지할 수 있으니, 약속을 깨고 싶은 유혹이 그만큼 크다.

그래서 앤트로픽은 앞으로 몇 달간 정책결정자와 연구자, 시민사회, 경쟁 AI 기업까지 한자리에 불러 이 문제를 함께 논의하고 결과를 공개하겠다고 밝혔다. 운전대를 완전히 놓아 손쓸 수 없게 되기 전에, 다 함께 브레이크부터 마련해야 한다는 제안이다.