[NDC2021] 기업에 '재산'이 되는 데이터는 어떤 걸까?

게임뉴스 | 윤홍만 기자 |



  • 주제 : 기업의 데이터 자산 관련 제도 현황 - '기업의 자산이 되는 데이터는 무엇일까?'
  • 강연자 : 손승우 - 중앙대학교 산업보안학과
  • 발표분야 : 데이터분석
  • 권장 대상 : 데이터의 보호, 활용에 관심이 있는 분
  • 난이도 : 사전지식 불필요 : 관련 전공이나 경력이 전혀 없더라도 이해할 수 있는 내용


  • [강연 주제] 디지털 대전환을 맞이하여 새로운 사회적·경제적 가치를 어떻게 만들 수 있을까요? AI와 빅데이터는 그간 우리가 직면한 사회적 난제들을 해결해 줄 것으로 기대하고 있습니다. 저는 최근 데이터 3법 시행 이후 데이터 활용과 관련된 일련의 입법들이 활발히 이루어지고 있는데 그 중심에 있는 데이터 활용 이슈를 다루고자 합니다.

    오늘날 세계는 디지털 대전환 시대를 맞이하고 있다. 기업들은 저마다 빅데이터를 활용하는데 혈안이 되고 있고 이에 대한 법제화 역시 활발히 이뤄지고 있다.

    디지털 경제 규모 역시 전에 없이 거대해졌다. 전 세계 디지털 경제 규모는 작게는 GDP의 4.5%에서 넓게는 무려 15.5%에 달한다고 추산될 정도다. 앞으로 더욱 커질 디지털 경제다. 그러나 이를 위해선 해결해야 할 문제들이 있다. 가명정보를 비롯해 저작권, 그리고 개인정보 보호 등 어느 것 하나 쉽게 해결할 수 없는 것들이다.

    이날 강연에 나선 손승우 교수는 미래의 자원이 될 '데이터'를 둘러싼 각종 이슈를 이날 소개했다. 게임사를 비롯해 빅데이터 활용에 대해 고민하고 관심이 있는 사람들이라면 이번 강연을 놓치지 말길 바란다.




    ■ PART #1 - 데이터 경제의 서막
    .



    게임 산업에서 데이터는 어떻게 사용될까. 흔히 빅데이터라고 불리는 이러한 데이터를 게임 산업에서 분석, 활용하는 방법은 크게 네 가지로 구분할 수 있다.

    먼저 채널 분석 데이터다. 유입경로 및 채널별 이용자를 분석하는 것으로 이용자 누적수량을 비롯해 이용자 유지 및 사용시간 등에 대한 데이터를 수집하는 방식이다. 채널별로 서로 다른 유형의 이용자를 교차 대비하면 이용자의 행위를 분석하는 것도 가능하며, 이러한 분석 데이터를 기반으로 마케팅 효과를 강화하는 데 쓰이곤 한다.

    이용자 유지 데이터를 통해서는 게임의 품질과 이용자가 게임을 하는 이유 등의 요인을 알 수 있다. 해당 데이터는 일간, 주간, 월간 단위로 이용자 수 통계를 통해서 기존 콘텐츠 가치와 새로운 유저를 유인할 수 있는 능력을 평가하는 데 쓰인다.

    세 번째인 이용자 행위 데이터는 이용자의 행동 패턴을 분석하는 방법이다. 접속 현황부터 게임 플레이, 레벨 상승, 게임 아이템 구매 등 이용자의 게임 내 활동 로그 데이터 분석을 통해 이용자의 행동 패턴을 추출, 예측하는 것으로 이를 잘 활용하면 회사의 수익화에 크게 기여할 수도 있다.

    게임의 기본적인 서비스 품질 개선을 위해서도 쓰인다. 오류 데이터를 수집하는 것으로 개발자 입장에서는 이렇게 수집한 데이터를 통해 게임의 질을 개선할 수 있고 안정적으로 운용할 수 있도록 가이드를 마련하는 것도 가능하다.

    물론, 이게 전부는 아니다. 이외에도 연령, 학력, 직업, 수입 등에 대한 이용자 프로필 데이터 분석을 통해 타겟 고객을 검증하는 식으로 활용할 수도 있다.

    이처럼 오늘날 데이터는 게임의 흥망성쇠를 결정하는 중요한 요소로 자리매김했다. 그러나 데이터를 더 잘 활용하기 위해선 우선 데이터를 활용하는 환경부터 바꿀 필요가 있다. 앞서 데이터 활용 방법에 대한 부분을 봤다면 알 수 있겠지만, 게임사에서 분석하는 데이터의 상당수는 '유저'에 대한 것으로, 개인정보가 상당 부분을 차지한다.




    민감할 수밖에 없는 요소로 이러한 개인정보를 앞으로 더 잘 활용하기 위해 도입된 게 바로 '가명정보'다. 가명정보란 개인정보의 일부를 삭제하거나 암호화 처리해서 특정 개인을 알 수 없도록 하는 것으로 개인정보를 수집, 처리할 때는 정보 주체의 동의가 필요하지만, 가명정보는 동의가 없어도 일정한 목적으로 처리할 수 있어서 빅데이터의 산업적 활용을 촉진할 것으로 예상되고 있다.



    ■ PART #2 - 데이터 거래 생태계 형성

    현재 우리나라는 데이터 경제로의 전환에 빠르게 대응하기 위해서 범국가적 프로젝트로 디지털 뉴딜 정책을 추진 중에 있다. 2025년까지 총 사업비 160조 원을 투자해서 190만 개의 일자리를 창출할 계획을 수립하고 있는데 그 중 38.5조 원을 D.N.A(Data, Network, Ai) 생태계 강화에 투자할 예정이다.

    데이터와 관련해서는 대표적인 정책으로 데이터 댐 사업을 들 수 있다. 데이터를 수집해 필요한 곳에 데이터를 흘려주는 역할을 하는 사업으로, 여기에는 공공 데이터 14만 개 개방과 기업이 데이터를 구매할 수 있도록 하는 데이터 바우처 사업이 포함된다. 대표적으로는 지난 2013년 오픈한 '데이터스토어'를 들 수 있다. 서비스 개발, 데이터 분석 등 사업에 필요한 데이터를 쉽게 사고팔 수 있도록 한 것으로, 현재 약 1,500종의 데이터를 제공하고 있다.

    물론, 아직 국내 데이터 거래는 본격적으로 활성화되지 않은 상태다. 하지만 데이터 유통 및 활용에 대한 산업적 수요는 나날이 커지고 있어서 이에 대한 대비가 그 어느 때보다 필요한 상태다.




    중국은 이와 관련해 가장 앞선 국가다. 2015년 4월 귀이양 빅데이터 거래소를 세계 최초로 오픈했으며, 이어서 2016년 상해 데이터 거래소를 오픈했다. 데이터는 규모의 경제의 대표적인 요소인 만큼, 양적 면에서 규모의 경제를 실현할 수 있는 중국이나 미국과 직접 대결은 불가능에 가깝다. 그렇기에 우리나라는 정확한 양질의 산업 데이터를 생산하는 것으로 질적인 면에서 이들과 경쟁해야 한다.

    이러한 데이터 거래에서 가장 중요한 역할을 하는 게 바로 '브로커'다. 이들 브로커는 데이터 거래 시장이 커지면서 함께 성장하고 있는데, 가장 앞선 기업으로는 미국의 액시옴 시스템즈와 코어로직 등이 대표적이다. 이들은 각각 7억 명의 소비자 DB와 8억 건의 부동산 거래 정보 등을 보유하고 있으며, 이를 산업계와 정부에 분석 자료로 판매하는 식으로 매출을 올리고 있다.

    국내에서도 민간 분야에서 데이터 거래 플랫폼 구축에 혈안이다. 네이버 클라우드 플랫폼, SKT 데이터 허브, KDX 등으로 이들이 소위 말하는 데이터 거래에 대한 수요를 견인할 것으로 예상되고 있다.




    정부 주도로 진행 중인 부분도 있다. 정부에서는 2019년부터 3년 간에 걸쳐서 10개 분야의 빅데이터 플랫폼을 구축하고 있는데 이러한 빅데이터 플랫폼을 통해 양질의 데이터를 생산하는 게 목표다. 예를 들어 암센터가 주관 기관이라고 하면 여러 병원들이 암센터로서 들어와 암 데이터를 올리게 되면 그 데이터들을 서로 결합해서 굉장히 가치 있는 새로운 정보를 만들게 되고 그걸 통해서 새로운 비즈니스 모델을 만드는 식이다.



    ■ PART #3 - 데이터란 무엇인가? 데이터의 오너쉽?




    이쯤에서 원론적인 얘기를 해보자. 그렇다면 과연 거래의 대상이 되는 데이터란 과연 무엇일까. '데이터 기본법'에 따르면 데이터란 관찰, 실험, 조사, 수집 등으로 취득하거나 정보시스템 및 소프트웨어 진흥법 제2조 제1호에 따른 소프트웨어 등을 통하여 생성된 문자, 숫자, 도형, 도표, 이미, 영상, 음성, 음향 등의 재료 또는 이들을 조합으로 처리된 것이라고 정의하고 있다. 간단히 말하자면 데이터란 최소 단위의 정보의 재료이자 이들의 결합을 의미하는 셈이다.

    이러한 데이터는 오늘날 자금이나 상품처럼 하나의 자산으로 여겨지고 있다. 그렇기에 이러한 데이터를 보호하기 위한 법제화가 그 어느 때보다도 시급하다.

    물론 기본적으로 데이터는 법에 의해 보호 받고 있다. 다만, 이 경우 구조화된 데이터에 국한된다는 게 문제다. 데이터는 크게 구조화된 데이터와 비구조화된 데이터로 나뉜다. 구조화된 데이터는 관계 데이터베이스에 적합한 구조로 된 데이터로, 편집물로서의 데이터로 저작권법에 의해 보호를 받고 있다. 하지만 블로그나 SNS 등의 소셜 미디어에 사용된 문자 데이터 등은 굉장히 다양한 분야의 데이터를 포함하고 있고 빠르게 그 양이 증가하고 있지만, 대부분은 비구조화된 데이터이기에 저작권법에 거의 보호를 받지 못하고 있다. 중요한 건 빅데이터라고 하는 것의 대부분이 비구조화된 데이터를 의미한다는 것이다. 그만큼 중요한 데이터임에도 아직 법적 보호가 미흡한 만큼, 이에 대한 대책 역시 필요한 상황이다.

    여기서 문제가 되는 게 바로 소유권, 오너쉽에 대한 부분이다. 안타깝게도 데이터의 소유권은 인정되지 않고 있다. 기본적으로 소유권이라고 하면 물건, 전기, 기타 관리할 수 있는 자연력에 대한 물권적 지배권을 의미하기 때문이다. 데이터는 무체물로서 민법상 물건에 해당하기 않기에 권리의 객체가 될 수 없다.




    그렇다면 데이터에 대한 보호가 없다면 데이터 거래도 불가능할까. 그건 아니다. 소유권을 인정하진 않지만, 해당 데이터에 접근이나 이용을 통제할 수 있는 채권적 지위는 인정하기 때문이다.

    실제로 데이터의 베타적 권리를 부여하는 건 쉽지 않은 일이다. 예를 들어 배타적 권리를 부여한다고 해보자. 빅데이터를 보면 알겠지만, 타인의 데이터가 굉장히 많이 포함되어 있다. 그렇기에 정보 주체라든지 많은 사람들이 자기 권리를 주장할 것이고 이는 곧 분쟁의 소지가 될 수도 있다. 그렇기에 데이터 기본법은 기본적으로 데이터에 대한 배타적 권리를 부여하기 보다는 경쟁법적 원리에 입각해서 간접적으로 보호하는 형태를 취하고 있다.



    ■ PART #4 - 데이터 분석을 위한 저작물 활용과 법적 책임




    그렇다면 빅데이터에 활용하는 데이터들의 저작권 책임은 없는 걸까. 비구조화된, 비정형 데이터에는 많은 저작물이 포함되어 있는 경우가 많다. 빅데이터에 활용하는데 장애물이 되는 셈이다. 이런 건 일일이 파악하기도 힘들고 허락 받기도 어렵다. 사실상 데이터 분석이 불가능한 셈이다.

    따라서 우리나라를 비롯한 많은 국가에서는 데이터 면책에 관한 규정을 신설하기 위해 노력하고 있다. 텍스트&데이터 마이닝(TDM)이라고 부르는 것으로, 데이터 기본법 제13조에 따르면 정보 분석을 위한 데이터 이용에 있어서 저작권 침해에 대한 면책과 정보 주체가 스스로 공개한 개인정보의 수집, 분석에 대해서는 면책 한다고 규정하고 있다.

    저작물에 대한 침해 외에도 해결해야 할 건 또 있다. 개인 정보에 대한 부분이다. 데이터 기본법은 데이터 '분석'을 목적으로 정보 주체가 스스로 SNS 등에 공개한 데이터를 이용할 수 있도록 허용하고 있는데, 이 부분에 대해서 개인정보 침해에 대한 우려로 시민 단체 등이 반발하고 있는 상황이다. 즉, 빅데이터 이용과 관련해 명확한 법제화와 사회적 협의가 필요하다고 할 수 있다.



    ■ PART #5 - 흩어져있던 데이터를 하나로 마이데이터




    오늘날 데이터를 활용하는 방법은 점차 고도화되고 있다. 마이데이터(MyData)가 대표적이다. 정보 주체의 여러 데이터를 한곳에 모아서 사업자가 그 정보를 결합해 다양한 형태의 맞춤형 정보로 제공할 수 있도록 하는 서비스로 이를 통해 정보 독점을 해소하고 정보 주체의 데이터 통제권을 강화하고자 하는 움직임이다.

    다만, 마이데이터 사업이 가야 할 길은 아직도 멀다. 현재의 마이데이터 사업은 신용정보법을 근간으로 하고 있기에 마이데이터 사업을 통해 정보를 전송하고 제공하는 그런 것들은 신용정보법과 관련된 부분으로 한정되어 있다. 앞으로 더욱 쉽고 많은 데이터를 사용할 수 있도록 환경이 갖춰줘야 하는 셈이다.

    마이데이터 사업에 관한 내용을 마지막으로 손승우 교수는 "데이터와 관련한 각종 이슈와 쟁점에 대해 말했는데, 이를 통해 데이터를 이해하는데 도움이 됐길 바란다"며, 강연을 끝마쳤다.

    댓글

    새로고침
    새로고침

    기사 목록

    1 2 3 4 5