'AI 산업화 초석' 데이터 170종 개방…민·관 활용협의회도 출범

18일 서울 마곡동 LG사이언스파크에서 열린 인공지능(AI) 데이터 활용협의회 출범식에서 임혜숙 과학기술정보통신부 장관과 참가자들이 사진촬영을 하고 있다. 이동근기자 foto@etnews.com
18일 서울 마곡동 LG사이언스파크에서 열린 인공지능(AI) 데이터 활용협의회 출범식에서 임혜숙 과학기술정보통신부 장관과 참가자들이 사진촬영을 하고 있다. 이동근기자 foto@etnews.com

인공지능(AI) 기술·서비스 개발과 고도화 기반이 될 대규모 AI 학습용 데이터가 공개된다. 한국형 AI 산업화 초석이 될 것으로 기대된다.

과학기술정보통신부는 한국지능정보사회진흥원(NIA)과 30일까지 순차적으로 AI 학습용 데이터 포털 'AI 허브'에 자연어·헬스케어·농축수산·비전(영상)·안전 등 8대 분야 170종, 4억8000만건 데이터를 공개한다.

개방되는 데이터는 스타트업이나 개별 연구자 등이 자체 구축하기 어려운 대규모 데이터다.

정부와 국내 주요 AI·데이터 전문기업은 물론이고 서울대·KAIST 등 전국 주요 대학 48개, 서울대병원·아산병원 등 25개 병원 등 총 674개 기업·기관, 국민 4만여명이 함께 데이터를 발굴했다.

지역별 방언을 포함한 한국어, 국내 주요 도로와 국내 환자 의료영상 데이터 등 국내 상황에 맞는 서비스 개발을 위한 '한국형 AI 학습용 데이터'를 확보했다.

과기정통부는 18일 기업·기관이 공인한 품질 우수 데이터와 개인정보 비포함 데이터 60종을 시작으로 30일까지 총 170종 데이터를 공개할 예정이다. 개인정보·민감정보가 포함될 우려가 있는 헬스케어 등 데이터 59종은 최종 검증을 거쳐 30일 개방한다.

대규모 AI 학습용 데이터 공개는 비용·인력 문제로 데이터를 구축하기 어려운 중소기업·스타트업과 개인 개발자의 '데이터 갈증'을 해소할 것으로 전망된다. 대기업도 자체적으로 확보하기 어려운 데이터도 대거 포함, AI 기술·서비스 개발이 본격화될 것으로 기대된다.

개방 데이터 활용을 위해 AI 허브도 직관적으로 개편했다. NIA는 하나의 페이지에서 모든 서비스를 이용할 수 있도록 '원 페이지 스타일 레이아웃' 환경을 구현했다. 하반기 중 키워드 활용 데이터 확인이 가능하도록 검색기능을 고도화할 계획이다.

과기정통부는 개방 데이터 활용 활성화를 위해 'AI 데이터 활용협의회'를 출범했다.

협의회에는 LG·네이버·삼성전자·SK텔레콤·현대자동차·KT 등 대기업과 딥노이드·스트라드비젼·비바엔에스 등 스타트업, KAIST·광주과학기술원(GIST) 등 학계, 한국전자통신연구원(ETRI)·농림수산식품교육문화정보원·TTA·NIA 등 19개 기관이 참여한다. 향후 참여 기관·기업을 보다 확대할 계획이다.
임혜숙 과기정통부 장관은 “누구나 사용할 수 있는 대규모 AI 학습용 데이터를 개방, 양질의 데이터 부족 문제를 해소할 수 있는 체계를 만들었다”며 “대기업·중소기업·스타트업·학계 간 데이터 공동 연구와 서비스 개발 등 상생 협력을 촉진하고 새로운 가치를 창출할 기회이자 정보통신기술(ICT) 산업을 도약시키는 중요 기반이 될 것”이라고 밝혔다.

임혜숙 과학기술정보통신부 장관(왼쪽 첫번째)이 AI 데이터 활용협의회 출범식에서 축하인사를 하고 있다. 이동근기자 foto@etnews.com
임혜숙 과학기술정보통신부 장관(왼쪽 첫번째)이 AI 데이터 활용협의회 출범식에서 축하인사를 하고 있다. 이동근기자 foto@etnews.com

박종진기자 truth@etnews.com