日 정부, 빅데이터 공동활용 포털사이트 만든다

일본 정부가 중앙 정부와 지방 정부, 민간 보유 빅데이터 개방을 추진한다. 용어와 양식을 통일해 민관이 광범위한 데이터를 쉽게 이용하고 분석할 수 있게 하기 위해서다. 기업이 빅데이터를 상품개발과 서비스 향상에 활용할 수 있게 하는 게 목표다. 내년 일본에서 열릴 주요 20개국(G20) 정상회의에서 유럽과 미국에도 참가를 요청하고 2020년엔 새로운 포털사이트도 개설한다.

니혼게이자이신문에 따르면 일본 정부는 현재 각종 통계와 지도 등의 정보를 일반 사이트에 공개하고 있으나 용어와 양식, 파일형식 등이 통일돼 있지 않다. 지방 자치단체 데이터가 부족하고 민간기업 정보는 아예 없다.

정부가 새로 개설할 포털사이트는 농업, 교통, 인프라, 각종 재난방지, 의료 등 광범위한 분야를 대상으로 한다. 농업은 농가와 농협에서부터 파종, 물관리, 토양관리 등의 정보를 수집한다. 교통 분야는 택시, 버스회사에서부터 도로, 지도, 교통량, 의료분야의 경우 익명 처리한 이용자의 건강정보 등을 공개한다.

<사진출처:게티이미지뱅크>
<사진출처:게티이미지뱅크>

이렇게 되면 각각 따로 갖고 있던 데이터를 대조하면서 인공지능(AI)을 이용, 정확도가 높은 분석이 가능할 것으로 기대된다. 예를 들어 기상정보를 토대로 가장 적합한 수확 시기를 판단하거나 교통량에 근거해 도로 보수시기를 예측하는 일이 가능할 것으로 보인다.

새로 만들 포털사이트에서는 누구라도 폭넓은 데이터에서 자신이 원하는 자료를 금세 찾아내 다운로드받을 수 있다. 프라이버시와 안보에 관한 정보는 자치단체에 한해 열람할 수 있게 하는 등 제한도 이뤄진다.

기업 참여를 장려하기 위해 유료정보도 취급한다. 휴대전화 회사 고객정보를 익명으로 처리한 위치정보는 소정의 요금을 낸 사람만 열람할 수 있게 한다. 현재 자치단체와 기업 등이 기록하는 데이터는 용어와 양식이 각기 다르다. '시청'을 '시청사'나 '관공서'로 서로 다르게 표시해 인공지능이 이해하지 못하는 경우도 있다.

새 용어는 사단법인 데이터유통추진협의회와 연대해 행정용어에서부터 산업용어에 이르기까지 광범위한 분야에서 통일을 추진한다. 양식도 통일한다.

지금은 시간 표시를 '10시 30분'으로 하는 곳이 있는가 하면 '10/30'이나 '10-30' 등으로 각각 다르다. 연도 표기도 '2018년'이나 '18년'으로 서로 다른 경우가 많고 파일형식도 다르다. 빅 데이터 폭을 넓히기 위해 미국과 유럽연합(EU) 등 외국 보유 데이터와의 접속도 추진한다. 정부가 개설하는 포털사이트에서 영어로 검색, 외국 데이터를 찾아내 다운로드할 수 있게 해 전 세계를 무대로 뛰는 기업의 활동을 지원한다는 복안이다.

김명희기자 noprint@etnews.com