[ICT 시사용어] 데이터댐

데이터댐 개념도
데이터댐 개념도

데이터댐은 사회, 경제, 인프라 전반에서 생성되는 빅데이터를 초연결 통신망을 이용해 수집하고 인공지능(AI)으로 분석하도록 인프라를 구축하는 국가 프로젝트다.

데이터댐은 정부가 추진하는 디지털뉴딜의 핵심 사업이다. 대규모 국가 재정을 투입해 경기를 부양하고, 미래 국가 경쟁력을 높일 디지털인프라를 선제 구축하는 효과를 추구한다. 미국 대공황 시기에 후버댐 건설 효과로 일자리 2만여개를 만들고, 미국 서남부 지역 농업용수를 책임질 국가 인프라를 확보한 프로젝트에 비견된다.

이 같은 목표를 달성하기 위해 데이터댐 프로젝트는 △AI 학습용 데이터 구축 △AI 바우처 △AI 데이터 가공바우처 △AI 융합 프로젝트(AI+X) △클라우드 플래그십 프로젝트 △클라우드 이용바우처 △빅데이터 플랫폼 및 센터 구축 등 7대 핵심 사업으로 구성된다. 2020년도에는 예산 4991억원이 투입된다.

'AI 학습용 데이터 구축'은 한국어 말뭉치, 암질환 영상, 자율주행기록 등 텍스트 7억건과 음성 6만시간 등 아날로그 데이터를 디지털화해서 AI 알고리즘 진화에 활용한다. 빅데이터 플랫폼 및 센터를 구축해 데이터를 저장하고, AI와 클라우드 이용바우처를 제공해 중소기업이 손쉽게 데이터와 AI 알고리즘을 활용하도록 지원한다.

데이터댐은 코로나19가 불러온 경제위기 극복을 위한 핵심 프로젝트로, 장기적으로 국가 디지털 전환에 일조할 사업으로 주목받고 있다.

박지성기자 jisung@etnews.com