[전문가기고]빅데이터와 딥데이터

[전문가기고]빅데이터와 딥데이터

빅데이터 비즈니스 최강자는 아마존이다. 온라인 서점으로 시작한 아마존에서 단 한 권의 책만 구매하면 내 호기심을 자극하는 추천 도서가 줄줄이 펼쳐진다. 넷플릭스도 내 취향을 저격하는 방송 콘텐츠를 기가 막히게 찾아준다. 한국 아마존을 지향하는 쿠팡 역시 괜찮은 맞춤 상품을 알려준다.

반면에 빅데이터 지존일 것 같은 구글 유튜브와 페이스북은 '상품 추천' 영역에서 아직 아마존이나 넷플릭스를 따라오지 못하는 듯하다. 돈 나가는 모바일 게임은 1년 넘게 써 본 적이 없는데도 필자 페이스북과 유튜브에는 항상 게임 광고로 도배된다.

데이터와 딥데이터의 차이다. 구매 완료된 상품을 이미 알고 있는 온라인 마켓은 연관 상품 추적에 대한 확신이 강해진다. 금융 서적을 구매한 사람이 4차 산업혁명 주제에 관심을 보인다면 '핀테크'라는 키워드로 연결할 수 있다. 제이슨 본 시리즈를 모두 관람한 사람은 맷 데이먼 주연의 '그린 존'에 반응할 것이다.

반면에 검색어나 페이지, 체류 시간 등 간접 정보로는 사용자가 원하는 상품 추천에 한계가 있다. 차라리 편의점에서 담배를 샀는지 강아지 간식을 샀는지와 같은 간단하지만 명확한 데이터가 더 쓸모 있는 실마리가 된다.

이 때문에 딥데이터는 분명 돈을 주고 살 만한 가치가 있다.

쿠팡, 11번가, G마켓, 옥션과 같은 인터넷 쇼핑몰은 딥데이터를 보유하고 있다. 단순한 구매액 정보가 아니다. 예를 들어 1개에 4만5000원짜리 카브리타 네덜란드 산양 분유 12~24개월 3단계를 구매했다는 데이터가 생성된다. 구매자 상황, 취향, 소비력을 한방에 캐치할 수 있는 실마리를 확보한 셈이다.

게다가 온라인 쇼핑몰은 회원 가입과 인증 절차를 통해 구매자 개인 정보도 동시에 보유한다. 누가, 무엇을, 언제, 어디에 쓸 것인지를 모두 알고 있으니 왜와 어떻게의 간단한 추론만 더하면 추가로 팔 수 있는 상품 목록이 수백개는 만들어진다.

그러나 아직도 한국 소비의 대부분은 오프라인이 장악하고 있다.

미래에셋대우에 따르면 2017년 기준 온라인 침투율이 가장 높은 산업 카테고리는 '가구'로, 40%에 약간 못 미친다. 여전히 오프라인 거래가 60%를 넘는다는 의미다. 온라인 침투율이 매우 높을 것 같은 가전제품도 30%가 안 된다. 신발·서적·화장품도 20%대, 의복과 음식료는 10%를 간신히 넘는 수준이다.

이처럼 대한민국 소비의 70~80%를 차지하는 오프라인에서 딥데이터는 상황이 전혀 달라진다. 일단 백화점, 마트, 편의점 등에서는 누가라는 질문에 100% 답하기 어렵다.

알뜰한 주부야 쇼핑 채널별로 회원카드를 만들고 꼬박꼬박 적립하겠지만 상당수 오프라인 거래는 그저 신용카드로 쓱 한 번 긁으면 끝이다. 상품 정보라는 딥데이터는 쇼핑 채널이 가지고 있지만 개인 식별을 위한 회원 정보는 오직 신용카드 회사만이 볼 수 있는 상황이다.

그런데 이 2개의 독립된 정보는 현행법상 서로 결합할 수 없다. 개인정보 보호법상의 개인정보란 살아 있는 개인에 관한 정보로, 성명과 주민등록번호 및 영상 등을 통해 개인을 알아볼 수 있는 정보를 뜻한다. 이는 개인정보 소유자의 명확한 동의 없이는 제3자에 제공할 수 없다.

최근 금융위원회는 '금융 결제 인프라 혁신 방안'을 통해 유럽의 PSD2 정책을 한국에서도 온전히 구현하겠다는 강한 의지를 표명했다. 바로 마이데이터 산업 활성화다.

금융위의 혁신 방안은 대부분 지급결제 분야를 위한 오픈뱅킹, 즉 지급결제개시서비스사업자(PISP)에 초점을 맞추고 있다. 그러나 빅데이터를 빼고 PSD2를 이야기할 수 없다.

핵심은 자기결정권 확보다. 개인의 식별 가능한 딥데이터 수집은 제한을 원칙으로 해야 한다. 합법의 정당한 절차에 따라 수집돼야 하며, 데이터 생산 주체로부터 명시된 동의를 받아야 한다. 이 절차를 다 수행하고 난 후에는 데이터 제공에 따른 정당한 대가를 반드시 지불해야 하는 생태계를 마련해야 한다.

고용철 샵온에어 대표 humaneheart@naver.com