D·N·A 생태계 심장, '데이터 댐'…최기영 장관 "다양한 서비스 창출"

데이터 댐 개념도
데이터 댐 개념도

일반 댐은 강물을 저장해 농업, 전기생산 등에 폭넓게 활용하는 역할을 담당한다. '데이터 댐'도 마찬가지다. 강물 대신 데이터가 5G 망을 통해 수집·저장된 후 환경, 의료, 치안, 에너지 절감 등 다양한 산업 인공지능(AI) 분석에 활용하는 것을 의미한다.

최기영 과학기술정보통신부 장관은 18일 문재인 대통령의 '한국판 뉴딜' 디지털 경제 현장 방문에서 데이터 댐을 중심으로 디지털 뉴딜 추진 구상을 소개했다.

최 장관은 “강물을 저장하는 댐처럼 각종 데이터를 데이터 댐에 모으고 AI를 통해 환경·의료·치안 등 다양한 영역에서 서비스를 창출할 수 있다”고 설명했다.

데이터 댐은 데이터 수집부터 데이터 축적·가공, 데이터 활용까지 전반을 지원하는 개념이다.

데이터 수집은 다양한 부처에서 진행한다. △바이오·의료(복지부) △제조(중기부·산업부) △농림어업(농림·해수부) △공공(행안부) △에너지(산업부) △금융(금융위) △SOC(국토부) 등 분야별 주요 부처가 데이터를 모은다. 데이터 수집 과정에 5G, 사물인터넷(IoT), 드론, 로봇, CCTV 등 다양한 기술과 기기가 동원된다.

분야별 취합한 데이터는 축적과 가공 단계를 거친다. 정부는 수집·축적한 데이터를 10대 빅데이터 플랫폼에서 통합·관리한다. 데이터 거래 생태계 조성을 가속화한다. 기존 데이터를 AI 학습용 데이터로 전환하는 AI 학습용 데이터 구축(데이터 라벨링) 사업을 한다. 실시간 생성 데이터를 바로 AI 학습용 데이터로 전환할 수 있도록 지원한다. 민간·공공이 보유한 분야별 데이터를 쉽게 찾아 활용하도록 국가 데이터 지도(데이터 맵)를 구축한다.

축적·가공을 거친 데이터는 AI 등 데이터 활용 단계로 넘어간다. 'AI+X 프로젝트'를 추진해 대규모 데이터와 AI를 활용, 신시장 수요를 창출한다. 제한된 환경에서 공공이 보유한 데이터를 다양한 방식으로 AI로 분석해 실험하는 실증랩을 구축·운영한다. AI 학습용 데이터, 애플리케이션프로그래밍환경(API), 고성능 컴퓨팅 자원을 활용하는 AI 허브를 제공한다. 이를 통해 전 산업 분야별 AI를 확산하고 AI 활성화 기반을 조성한다.

최 장관은 “약국의 마스크 재고 정보를 알려주는 마스크 앱이나 데이터센터 에너지 소비를 절감하는 AI도 모두 데이터 댐을 통해 나온 것”이라면서 “이것이 바로 데이터의 힘”이라고 강조했다.

김지선기자 river@etnews.com