IT 새소식

전체보기

모바일 상단 메뉴

본문 페이지

[업계동향] Tesla의 3억 달러 규모 AI 클러스터가 오늘부터 가동됩니다

아이콘 Bector
조회: 198
2023-09-04 12:24:51

@SawyerMerritt 에 따르면 Tesla는 월요일에 매우 기대되는 슈퍼컴퓨터를 출시할 예정입니다  . 이 머신은 다양한 인공 지능(AI) 애플리케이션에 사용되지만 클러스터는 매우 강력하여 까다로운 고성능 컴퓨팅(HPC) 워크로드에도 사용할 수 있습니다. 실제로 Nvidia H100 기반 슈퍼컴퓨터는 세계에서 가장 강력한 기계 중 하나가 될 것입니다.

Tesla의 새로운 클러스터는 10,000개의 Nvidia H100 컴퓨팅 GPU를 사용하여 기술 컴퓨팅의 경우 340 FP64 PFLOPS, AI 애플리케이션의 경우 39.58 INT8 ExaFLOPS의 최고 성능을 제공합니다. 실제로 Tesla의 340 FP64 PFLOPS는 세계 4위 성능의 슈퍼컴퓨터인 Leonardo가 제공하는 304 FP64 PFLOPS보다 높습니다.


Tesla는 새로운 슈퍼컴퓨터를 통해 FSD(완전 자율 주행) 기술을 그 어느 때보다 빠르게 교육할 수 있도록 컴퓨팅 성능을 대폭 향상하고 있습니다. 이는 Tesla를 다른 자동차 제조업체보다 더 경쟁력있게 만들 수 있을 뿐만 아니라 회사를 세계에서 가장 빠른 슈퍼컴퓨터 중 하나의 소유자로 만들 것입니다.

Tesla의 AI 인프라 및 AI 플랫폼 엔지니어링 관리자인 Tim Zaman은 "실제 비디오 교육으로 인해 우리는 세계에서 가장 큰 교육 데이터세트, 200PB를 넘는 핫 티어 캐시 용량, 즉 LLM보다 훨씬 큰 규모를 보유하게 될 것입니다."라고 설명했습니다.


새로운 H100 기반 클러스터는 Tesla의 훈련 속도를 획기적으로 향상시킬 예정이지만 Nvidia는 이러한 GPU에 대한 수요를 충족하기 위해 고군분투하고 있습니다. 그 결과 Tesla는 맞춤 설계되고 고도로 최적화된 시스템 온 칩을 기반으로 구축된 자체 슈퍼컴퓨터 Dojo를 개발하기 위해 10억 달러 이상을 투자하고 있습니다. 

Dojo는 FSD 교육을 가속화할 뿐만 아니라 Tesla의 전체 차량에 대한 데이터 처리도 관리합니다. Tesla는 Dojo와 함께 Nvidia H100 GPU 클러스터를 동시에 온라인으로 가져오며, 이는 자동차 산업에서 비교할 수 없는 컴퓨팅 성능을 회사에 제공할 것입니다.

Elon Musk는 최근 Tesla가 2023년에 AI 교육에 20억 달러 이상을 지출하고 2024년에는 특히 FSD 교육을 위한 컴퓨팅에 20억 달러 이상을 지출할 계획이라고 밝혔습니다. 이는 컴퓨팅 병목 현상을 극복하려는 Tesla의 의지를 강조하며 경쟁사에 비해 상당한 이점을 제공해야 합니다.

기사 원문 - https://www.tomshardware.com/news/teslas-dollar300-million-ai-cluster-is-going-live-today

Lv65 Bector

모바일 게시판 하단버튼

댓글

새로고침
새로고침

모바일 게시판 하단버튼

지금 뜨는 인벤

더보기+

모바일 게시판 리스트

모바일 게시판 하단버튼

글쓰기

모바일 게시판 페이징

최근 HOT한 콘텐츠

  • 견적
  • 게임
  • IT
  • 유머
  • 연예