[기획] 바이두 AI 개발자 컨퍼런스, 바이두 자체 AI 기술 무료 개방 선언!

기획기사 | 원동현 기자 |



바이두 AI 개발자 컨퍼런스가 지난 7월 5일 북경에서 개최됐다. 4천 명이 넘는 인원이 이번 컨퍼런스에 참여했으며 이는 바이두 역사상 최대 규모의 AI 컨퍼런스였다. 오전 개막 연설 중, 바이두 창업자 리옌훙(李彦宏), 총재 겸 COO 루치(陆奇), 사업부 사장 징쿤리우(景鲲陆)가 무대에 올라와 인사를 전했다. 그리고 오후에는 바이두가 AI 부문에서 어떤 방향으로 나아가고 있는지를 알 수 있었다.




바이두 부총재 겸 바이두의 AI 기술과 플랫폼 시스템(AIG) 책임자인 왕하이펑(王海峰)이 먼저 무대에 올라왔다. 그가 말하길, 대부분의 중요 인공지능 기술은 바이두 탐색엔진으로부터 지난 17년간 누적되온 유저 데이터 그리고 플랫폼을 응용한 것이며 바이두 AI 기술 발전의 초석이 됐다고 밝혔다.

오전에 리옌훙이 강연하며 '개방'이란 단어를 강조했던 것처럼, 왕하이펑 역시 이번 바이두 AI 개발자 컨퍼런스 이후 바이두의 완전한 AI 기술 플랫폼(60개의 기술이 담긴)을 개발자에게 개방할 것이라 밝혔다. 이번 컨퍼런스에서 언급된 '언어의 해석과 상호작용', '이미지/동영상 분류 및 해석 기술',' AR 기술 플랫폼', 그리고 'PaddlePaddle 딥러닝 플랫폼'까지 개방한다.



■ 음성 : 음성생태 2.0 전면 개방




음성 기술부 총 관리자 가오리양(高亮)이 먼저 무대에 올라와 바이두가 오늘날 완전히 업그레이드시킨 음성기술에 대해 소개했다. '음성개방생태2.0'이라 불리는 이 기술은 '거리 식별 기능', '오프라인 음성 인식', '다양한 하드웨어와의 호환' 등 여러 가지 방면에서 진화했다. 그리고 지금, 이렇게 업그레이드된 음성기술이 개발자들에게 전면 개방된다.




1) 원거리 음성 식별과 인식

식별 : Near-field data 기반, Near-field data에 증강 기술을 적용하여 원거리 음성으로 변환 및 인식

인식 : 빅데이터 기반, 인식/인식 오류 수정(음성언어식별모형 중, 디코더 등 부분적인 최적화와 밸런싱을 갖추는 작업), 유저 설정 가능

2) 맞춤화된 음성 언어 합성 기술 개방

맞춤화 TTS, SSML 태그 언어, 기초 태그, 바이두 확장성 제공

3) 음색 합성 기술 개방

자연적인 음색을 추구, 개성화 작업, 유명 스타 음성 합성

4) Emotional CUI 개방

대화하는 감각을 강화시킨다. 음량(화자의 감정, 태도 등), 음역(화자의 성격), 속도(화자의 감정, 뉘앙스), 음색(화자의 성별, 연령) 등 화자에게 개성을 부여하여 더욱 생동감 있는 대화를 가능하게 한다.



■ 언어 : UNIT 언어이해 커뮤니케이션 플랫폼


가장 중요한 건 결국 기계가 사용자의 언어를 알아들을 수 있게 만든는 기술이다. 바이두 자연언어처리부 책임자 조세기(赵世奇)는 바이두가 조만간 개발자들에게 언어이해와 상호작용 플랫폼 'UNIT(Understanding and Interaction Technology Platform)'을 개방할 것이라고 밝혔다.




UNIT 플랫폼은 개발자들에게 언어이해기술, 다중 상호작용 기술, 기초기술&기초데이터 등. 그리고 '트레이너' 모드도 만들었다. 개발자들이 로봇을 접하고 대화를 진행하면서 로봇이 사용자의 요구사항을 깨닫고 보다 깊이 있는 대화가 가능해지는 방식이다.

오전에 루치는 올해 안에 제13회 '바이두의 별' 개발자 컨퍼런스를 열 계획이라고 밝혔다. 그리고 조세기는 이번 행사의 주제가 'UNIT 플랫폼이 제공하는 언어이해와 상호작용 기술'이라고 언급했다.



■ DuMix AR 플랫폼




음성 관련 기술을 제외하고, 또 하나의 주목받는 상품은 바로 DuMix AR 기술 플랫폼이다. 개발자에겐 DuMix AR의 SDK, 콘텐츠 제작 툴, 클라우드 콘텐츠 플랫폼, 그리고 콘텐츠 유통 서비스가 제공된다.

바이두 증강현실 연구실 주임 우종친(吴中勤) 소개에 따르면 바이두 DuMix AR 플랫폼은 아래와 같은 특징을 가지고 있다.

1) 빅데이터 (검색 엔진 운영으로 누적된 막대한 양의 데이터)
2) 3D 감지와 트랙킹 (안정된 이미지 트랙킹)
3) 스마트 상호작용 (언어, 손동작, 얼굴)
4) 자체 개발한 초경량 AR 렌더링 엔진




데모영상과 현장 전시를 통해 접할 수 있었던 DuMix AR은 기초적인 AR 기능을 제공하는 것으로 밝혀졌다. 페이스북이나 애플이 최근에 내놓은 AR 플랫폼과 마찬가지로, 이 플랫폼의 의의는 AR 콘텐츠 제작의 문턱을 낮춰준다는 점에 있다.

이외에도, 바이두연구원 원장 린위엔칭(林元庆)이 무대에 올라 바이두가 현재 이미지 분류, 이미지 인식, 얼굴 인식, 동영상 분석 등 AI 기술을 응용한 다양한 개발을 진행하고 있다고 밝혔다. 바이두의 유명한 과학자 쉬웨이(徐伟) 또한 바이두의 딥러닝 오픈소스 플랫폼 PaddlePaddle을 소개했다.




글에서 보이듯이, 바이두는 이번 행사에서 전반적으로 '개방'이란 단어를 특히 강조했다. 이번에 바이두가 음성생태2.0, UNIT 상호작용 플랫폼, DuMix AR 플랫폼, 그리고 비교적 익숙한 PaddlePaddle을 모두 개방하기로 약속한 것은 향후 AI 산업에 기반을 쌓아두기 위한 것으로 보인다.


※ 중국의 VR 전문 미디어 87870.com과의 제휴로, 인벤에서 독점으로 번역 제공하는 기사(원문 링크)입니다. 앞으로 중국의 VR 관련 주요 뉴스를 꾸준히 소개해드릴 예정이니, 많은 구독 바랍니다.

댓글

새로고침
새로고침

기사 목록

1 2 3 4 5