AI 컴퓨팅 기술 분야의 선두주자인 엔비디아의 창립자 겸 CEO 젠슨 황(Jensen Huang)이 이번 주 대만 타이베이에서 열리는 컴퓨텍스(COMPUTEX) 기술 콘퍼런스 기조연설에서 산업을 재편하고 혁신과 성장을 위한 새로운 기회를 열어가고 있는 생성형 AI의 중요성에 대해 설명했다.
자신의 트레이드마크인 검은색 가죽 재킷을 입은 젠슨 황은 청중들에게 “오늘날 우리는 컴퓨팅의 중대한 변화의 정점에 서 있다. AI와 가속화된 컴퓨팅의 교차점이 미래를 재정의할 것”이라고 말했다.
젠슨 황은 세계 최대 기술 콘퍼런스 중 하나인 컴퓨텍스 개최를 앞두고 타이베이의 녹음이 우거진 중심부에 위치한 유리 돔형의 국립 타이베이 대학교 스포츠센터에서 기조연설을 진행했다. 이날 현장에는 6,500여 명의 업계 종사자, 언론, 기업가, 게이머, 크리에이터, AI 애호가들이 모였다.
다양한 엔비디아(NVIDIA) RTX 기반 기능을 갖춘 AI PC와 소비자 디바이스부터 엔비디아의 풀스택 컴퓨팅 플랫폼으로 AI 팩토리를 구축, 배포하는 기업까지, 엔비디아 가속 플랫폼이 본격적인 생산에 들어갔다는 내용이 골자를 이뤘다.
젠슨 황은 “컴퓨팅의 미래는 가속화되고 있다. AI와 가속 컴퓨팅 분야의 혁신을 통해 우리는 가능성의 한계를 뛰어넘고 차세대 기술 발전의 물결을 주도하고 있다”고 말했다.
1년 주기의 엔비디아 리듬
젠슨 황은 1년 주기로 출시될 새로운 반도체에 대한 로드맵을 공개하며 기대감을 높였다. 처음으로 공개된 루빈(Rubin) 플랫폼은 곧 출시될 블랙웰(Blackwell) 플랫폼의 뒤를 이을 플랫폼이다. 루빈은 새로운 GPU, 새로운 Arm 기반 CPU인 베라(Vera), NV링크 6(NVLink 6), CX9 슈퍼NIC(CX9 SuperNIC), X1600 컨버지드 인피니밴드/이더넷 스위치(X1600 converged InfiniBand/Ethernet switch)를 탑재한 고급 네트워킹이 특징이다.
젠슨 황은 “엔비디아의 리듬은 1년 주기다. 우리의 기본 철학은 매우 간단하다. 전체 데이터센터 규모를 구축하고, 1년 주기로 구성 부품을 판매하며, 모든 것을 기술의 한계까지 밀어붙이는 것"이라고 설명했다.
엔비디아의 크리에이티브 팀은 컴퓨텍스 기조연설을 위해 엔비디아 NIM과 엔비디아의 가속 컴퓨팅을 기반으로 구축된 엔비디아 인셉션(Inception) 스타트업 프로그램 회원사의 AI 툴을 사용했다. 현장에서는 다양한 시연을 선보이며 혁신적인 도구와 엔비디아 기술의 변혁적인 영향력을 강조했다.
가속 컴퓨팅은 지속 가능한 컴퓨팅
젠슨 황은 연설을 시작하면서 엔비디아는 데이터를 인텔리전스로 전환하는 데 드는 비용을 절감하고 있다고 말했다.
그는 “가속 컴퓨팅은 지속 가능한 컴퓨팅”이라고 강조하며, GPU와 CPU의 조합이 어떻게 전력 소비를 3배만 증가시키면서 최대 100배의 속도 향상을 제공하는 동시에 CPU만 사용할 때보다 와트당 25배 더 높은 성능을 달성할 수 있는지에 대해 설명했다.
젠슨 황은 “더 많이 구매할수록 더 많이 절약할 수 있다”며 이 접근 방식의 상당한 비용과 에너지 절감 효과를 강조했다.
새로운 산업 혁명을 주도할 AI 팩토리 구축을 위해 엔비디아와 협력하는 기업들
글로벌 IT 허브인 대만 기업들을 포함한 선도적인 컴퓨터 제조업체들이 엔비디아 GPU와 네트워킹 솔루션을 채택했다. 대표적인 기업으로는 클라우드, 온프레미스, 엣지 AI 시스템 등을 구축하고 있는 애즈락 랙(ASRock Rack), 에이수스(ASUS), 기가바이트(GIGABYTE), 인그라시스(Ingrasys), 인벤텍(Inventec), 페가트론(Pegatron), QCT, 슈퍼마이크로(Supermicro), 위스트론(Wistron), 위윈(Wiwynn) 등이 있다.
이제 엔비디아 MGX 모듈식 레퍼런스 디자인 플랫폼은 거대 언어 모델(large language model, LLM) 추론, 검색 증강 생성(retrieval-augmented generation, RAG), 데이터 처리에서 최적의 성능을 발휘하도록 설계된 GB200 NVL2 플랫폼을 포함한 블랙웰을 지원한다.
AMD와 인텔(Intel)은 처음으로 자체 CPU 호스트 프로세서 모듈 설계를 제공할 계획으로 MGX 아키텍처를 지원하고 있다. 모든 서버 시스템 빌더는 이러한 레퍼런스 디자인을 사용해 개발 시간을 절약하는 동시에 설계와 성능의 일관성을 보장할 수 있다.
스펙트럼-X(Spectrum-X)를 통한 차세대 네트워킹
네트워킹 부문에서는 AI용 고성능 이더넷 네트워킹에 대한 수요 증가에 대응하기 위한 스펙트럼-X제품의 연간 출시 계획을 공개했다.
AI용으로 구축된 최초의 이더넷 패브릭인 엔비디아 스펙트럼-X는 기존 이더넷 패브릭보다 네트워크 성능을 1.6배 이상 향상시킨다. AI 워크로드의 처리, 분석, 실행을 가속화해 AI 솔루션의 개발과 배포를 가속화할 수 있다.
스펙트럼-X를 도입해 AI 인프라에 극한의 네트워킹 성능을 제공하는 최초의 AI 클라우드 서비스 제공업체로는 코어위브(CoreWeave), GMO 인터넷 그룹(GMO Internet Group), 람다(Lambda), 스케일웨이(Scaleway), STPX 글로벌(STPX Global), 요타(Yotta) 등이 있다.
수백만 명의 개발자의 생성형 AI 개발을 지원하는 엔비디아 NIM
이제 전 세계 2,800만 명의 개발자가 엔비디아 NIM을 통해 생성형 AI 애플리케이션을 쉽게 구축할 수 있게 됐다. 모델을 최적화된 컨테이너로 제공하는 추론 마이크로서비스인 NIM은 클라우드, 데이터센터 또는 워크스테이션에 배포할 수 있다.
또한 기업들은 NIM을 통해 인프라 투자를 극대화할 수 있다. 예를 들어, 메타 라마 3-8B(Meta Llama 3-8B)를 NIM에서 실행하면 가속화된 인프라에서 NIM을 사용하지 않을 때보다 최대 3배 더 많은 생성형 AI 토큰을 생성할 수 있다.
케이던스(Cadence), 클라우데라(Cloudera), 코히시티(Cohesity), 데이터스택스(DataStax), 넷앱(NetApp), 스케일 AI(Scale AI), 시높시스(Synopsys) 등 200 여개의 기술 파트너가 NIM을 그들의 플랫폼에 통합하고 있다. 이들은 이를 통해 코파일럿, 코드 어시스턴트, 디지털 휴먼 아바타 등 도메인 특화 애플리케이션을 위한 생성형 AI 배포를 가속화하고 있다. 허깅페이스(Hugging Face)는 현재 메타 라마 3부터 NIM을 제공하고 있다.
젠슨 황은 “오늘 허깅페이스에 완전히 최적화된 라마 3를 게시했으며, 이제 사용해 볼 수 있다. 심지어 어디든 가져갈 수 있다. 모든 클라우드에서 실행하고, 이 컨테이너를 다운로드해 자체 데이터센터에 설치한 다음 호스팅해 고객이 사용할 수 있도록 할 수 있다”고 말했다.
지포스(GeForce) RTX AI PC를 통해 AI 어시스턴트에 생명을 불어넣는 엔비디아
RTX 기술로 구동되는 엔비디아 RTX AI PC는 200개 이상의 RTX AI 노트북과 500개 이상의 AI 기반 앱 및 게임으로 소비자 경험을 혁신할 예정이다.
RTX AI 툴킷과 새롭게 제공되는 엔비디아 ACE 디지털 휴먼 플랫폼용 PC 기반 NIM 추론 마이크로서비스는 AI 접근성에 대한 엔비디아의 노력을 보여준다.
RTX 기반 AI 어시스턴트 기술 데모인 프로젝트 G-어시스트(Project G-Assist)도 발표돼 PC 게임 과 앱에 대한 상황 인식 지원 기술을 선보였다.
또한 마이크로소프트(Microsoft)와 엔비디아는 개발자들이 RTX 가속 SLM에 대한 간편한 API 액세스를 통해 윈도우 네이티브나 웹 앱에 새로운 생성형 AI 기능을 도입할 수 있도록 협력하고 있다. RTX 가속 SLM은 윈도우 코파일럿 런타임(Windows Copilot Runtime)의 일부로 디바이스에서 실행되는 RAG 기능을 지원한다.
업계 리더들이 선택한 엔비디아 로보틱스
엔비디아는 효율성을 높이고 비용을 절감하는 가상 모델인 자율 운영과 디지털 트윈을 도입하는 산업 분야에서 50조 달러 규모의 산업 디지털 전환을 주도하고 있다. 엔비디아는 개발자 프로그램을 통해 NIM에 대한 액세스를 제공해 AI 혁신을 촉진하고 있다.
대만 제조업체들은 엔비디아의 기술을 사용해 공장을 혁신하고 있다. 젠슨 황은 폭스콘(Foxconn)이 엔비디아 옴니버스(Omniverse), 아이작(Isaac), 메트로폴리스(Metropolis)를 사용해 비전 AI와 로봇 개발 툴을 결합한 디지털 트윈을 만들어 로봇 설비를 개선한 사례를 소개했다.
젠슨 황은 “AI의 다음 물결은 물리적 AI이다. 물리 법칙을 이해하는 AI, 사람과 함께 일할 수 있는 AI"라고 말하며 미래 개발에서 로봇과 AI의 중요성을 강조했다.
엔비디아 아이작 플랫폼은 개발자가 젯슨 오린(Jetson Orin)과 토르(Thor)와 같은 AI 모델과 슈퍼컴퓨터로 구동되는 AMR, 산업용 로봇, 휴머노이드 등 AI 로봇을 제작할 수 있는 강력한 툴킷을 제공한다.
젠슨 황은 “로보틱스가 여기에 있고, 물리적 AI가 여기에 있다. 이것은 공상 과학 소설이 아니며 대만 전역에서 사용되고 있다. 매우 흥미롭다"고 덧붙였다.
글로벌 전자업체들은 엔비디아의 자율 로보틱스를 공장에 통합해 옴니버스에서 시뮬레이션을 활용하고, 물리적 세계를 위한 새로운 AI를 테스트, 검증하고 있다. 여기에는 전 세계적으로 사전 프로그래밍된 5백만 대 이상의 로봇이 포함된다.
젠슨 황은 “모든 공장이 로봇화될 것이다. 공장은 로봇을 조율하고, 로봇은 로봇화된 제품을 생산하게 될 것"이라고 설명했다.
젠슨 황은 BYD 일렉트로닉스(BYD Electronics), 지멘스(Siemens), 테라다인 로보틱스(Teradyne Robotics), 인트린직(Intrinsic)과 같은 글로벌 선도기업들이 엔비디아의 고급 라이브러리와 AI 모델을 활용해 공장과 창고 효율성을 높이는 데 있어 엔비디아 아이작이 중요한 역할을 한다고 강조했다.
에이디링크(ADLINK), 어드밴텍(Advantech), 오닉스(ONYX) 등의 파트너와 함께 IGX 플랫폼의 엔비디아 AI 엔터프라이즈(AI Enterprise)는 의료 기술과 기타 산업에 필수적인 엄격한 규제 표준을 충족하는 엣지 AI 솔루션을 제공한다.
젠슨 황은 기조연설을 시작할 때와 마찬가지로 대만과 많은 대만 파트너사들에게 감사를 표하며 기조연설을 마무리했다.