'데이터 댐' 프로젝트 가동···2100개 사업자 참여·5000억원 예산 투입

@게티이미지뱅크
@게티이미지뱅크

정부가 디지털뉴딜 핵심으로 추진하는 '데이터 댐' 프로젝트가 본격화된다.

경제와 산업 전반에서 생성되는 빅데이터를 초연결 통신망으로 수집하고 인공지능(AI)으로 분석하는 인프라를 조성, 일자리를 창출하고 국가차원 디지털 혁신 기반을 조성할 것으로 기대된다.

과학기술정보통신부는 데이터댐 프로젝트 7대 핵심사업 수행 기업·기관 선정 작업을 성공적으로 완료, 이달부터 사업을 추진한다고 2일 밝혔다.

◇데이터댐 프로젝트 '흥행 성공'

데이터댐 프로젝트는 △AI 학습용 데이터 구축 △AI 바우처 △AI 데이터 가공바우처 △AI 융합 프로젝트(AI+X) △클라우드 플래그십 프로젝트 △클라우드이용 바우처 △빅데이터 플랫폼 ·센터로 구성된다. 정부는 연내 총 4991억원을 투입해 미래를 대비한 디지털 인프라를 구축하고, 일자리를 창출하겠다는 목표다.

과기정통부는 당초 예상을 넘은 총 4739개 기업·기관이 사업을 신청해 총 2103개 수행기업·기관을 선정했다고 밝혔다. 공공에서 16개 정부부처와 20여개 전문기관이 참여하는 등 민간과 정부를 대표하는 범 국가 프로젝트 위상을 확보했다는 평가다.

참여기업 계획서 검토한 결과, 과기정통부는 당초 2만4000개로 예상했던 일자리 창출효과가 2만8000개로 증가할 것으로 예상했다.

AI 데이터바우처 사업의 경우, 헬스케어, 제조, 유통 등 非 정보통신기술(ICT) 분야 기업이 84.8%를 기록했다.

AI와 데이터 활용에 대해 국내 모든 산업계가 높은 관심을 보이고 있다는 방증이다.

7월초 추경예산 통과이후 약 2개월 만에 다양한 산업 분야 국내 대표기업이 다수 참여하며 성황리에 준비를 완료한 것으로 평가된다.

◇AI·클라우드 인프라 확산

기업과 공공기관은 일부 과제부터 데이터댐 프로젝트를 시작한다.

AI 학습용 데이터 구축사업은 584개 기업·기관이 2925억원을 투입해 데이터댐 기초가 되는 AI 학습용 데이터를 대규모로 구축한다. 자연어와 헬스케어, 자율주행 등 10대 분야에서 150종 데이터를 구축한다.

한국어 말뭉치, 농작물 병해충 이미지, 암질환 영상 텍스트 7억건, 음성 6만시간, 이미지 6000만건, 영상 1만5000시간 등 아날로그로 존재하던 정보를 디지털 정보로 전환한다. 저장 과정에서 수작업이 필요한 부분으로, 일자리 창출 효과를 노렸다.

민간이 원하는 AI 데이터를 활용하도록 하는 사업도 전개된다.

AI 바우처 사업은 중소벤처기업당 최대 3억원(총 560억원)을 지원, 제품과 서비스에 필요한 AI를 전문기업으로부터 제공받도록 했다.

AI데이터 가공바우처 지원사업에는 총 489억원이 투입된다. 스타트업 등 AI 학습용 데이터가 필요한 수요기업이 바우처를 신청하면, 공급기업이 AI에 사용하도록 가공해 제공한다.

클라우드 플래그십 프로젝트에는 250억원을 투입한다. KT, NBP, NHN 등 10여개 이상 유력 기업이 연합해 세계적 클라우드 서비스를 개발하는 프로젝트다. 기업 당 최대 2000만원을 지원해 클라우드 인프라를 이용하도록 하는 '클라우드바우처' 사업도 전개될 예정이다.

데이터 댐 프로젝트로 AI와 클라우드를 중심으로 국가적 데이터 활용 기반을 확보하는 효과가 기대된다. 방대한 데이터에 대한 표준화는 과제다. 과기정통부는 '데이터구축 공통 가이드라인'을 수립하고, 자율주행, 의료분야 등 'AI 학습용 데이터 표준안'을 개발해 데이터 품질을 관리할 방침이다. AI 활용 규제 걸림돌을 제거하도록 11월에는 'AI분야 법제도 개선 로드맵'을 제시할 계획이다.

최기영 과기정통부 장관은 “민간의 투자와 참여가 중요한 만큼 법·제도적 인프라 구축을 병행하겠다”며 “디지털뉴딜반을 운영하며 관계부처와도 긴밀히 협력해 데이터 댐 프로젝트를 차질없이 시행하겠다”고 말했다.

박지성기자 jisung@etnews.com