서울형 디지털뉴딜 시동, AI 학습데이터 구축해 개방한다

데이터라벨링 이미지. 사진=슈퍼브에이아이
데이터라벨링 이미지. 사진=슈퍼브에이아이

서울시가 인공지능(AI) 학습데이터 구축 사업을 시작한다. 정부가 최근 발표한 한국형 뉴딜 사업에 부응해 디지털 시정을 구축하고 공공데이터를 민간에 개방하는 것이 목표다.

28일 서울시에 따르면 시는 9월부터 12월까지 '서울형 뉴딜일자리 AI 학습데이터 제작 사업'을 진행한다.

올해 50여명을 대상으로 AI 학습데이터 수집과 데이터 라벨링 작업을 실시한다. 만 18세 이상~39세 이하 서울시민을 대상으로 4개월간 주 40시간 시급 약 1만원 일자리를 제공한다.

선발한 인원은 데이터 수집과 라벨링 작업 등 AI 학습데이터 제작에 투입한다. 서울시가 보유한 공공데이터를 기반으로 AI가 학습할 수 있는 데이터를 구축하는 업무다.

서울시는 올해 사업을 시작으로 내년부터 시정 공공분야 AI 학습데이터 사업을 확대할 계획이다.

전 부서 수요조사와 관련분야 전문가를 통해 시정 AI학습데이터 구축 분야를 발굴한다. 민간이 필요로 하고 시가 활용할 수 있는 공공분야 AI 학습데이터 자원을 축적한다. AI 학습데이터를 시 자산으로 만들겠다는 것이다.

확보한 데이터는 열린데이터 광장을 통한 데이터 개방해 민·관·산·학이 상호 공유 협력할 수 있는 기반을 제공한다. 학습데이터를 활용한 해커톤 등 시민참여 행사 개최하고 시정에 AI 서비스를 도입하는 개발 프로젝트를 추진한다.

시는 이와 별도로 한국정보화진흥원(NIA)에서 주관하는 'AI 학습용 데이터 구축사업'에도 참여하는 방안도 검토 중이다. 이 사업은 7월 정부가 합동 발표한 한국판 뉴딜 사업의 일부다.

이 사업 역시 시정 등 공공 분야에 AI 시스템 구축을 도입하는 것이 목적이다. 시는 7월 현재 서울시 전 부서와 산하 사업소를 대상으로 수요조사에 들어갔다.

서울시 관계자는 “NIA 학습데이터 프로젝트 참여를 긍정적으로 검토 중”이라면서 “궁극적으로 시정에 활용할 수 있는 데이터를 구축하고 이를 민간에도 개방해 협력하는 방안을 찾고 있다”고 말했다.

AI 학습데이터는 인공지능이 인식, 식별, 추론 등 지능형 서비스를 수행할 수 있도록 기계를 훈련시키는 데이터다. 단순 작업이지만 AI 산업에 필수다.

영상, 이미지 등 비정형·정형자료에 사람이 인식표를 붙이는 작업이 핵심이다. 예를 들어 공공분야에서는 사진에 찍힌 전주, 하수관 등 시설물 훼손을 AI가 판별하는 서비스를 개발할 수 있다. 사람이 지정한 훼손 사례를 보고 AI가 학습한 후 대량의 데이터를 자동으로 분석하는 방식이다.

정부는 앞으로 진행할 디지털 뉴딜 사업 예산 9000억원 중 약 3000억원을 AI 학습데이터 구축에 투입할 방침이다.

김시소기자 siso@etnews.com