ETRI, '개방형 빅데이터 허브' 개발...데이터 생태계 지원 나선다

한국전자통신연구원(ETRI)이 누구나 한 곳에서 국내외 데이터를 찾아 분석·활용하는 개방형 빅데이터허브서비스(SODAS)를 개발했다. 데이터 검색·유통 등에 필요한 기술과 플랫폼을 제공, 데이터 산업 활성화에 기여할 것으로 기대된다.

SODAS는 국제표준 기반으로 데이터 중개, 품질, 이력관리, 거래, 활용까지 확대한 데이터 허브 핵심 기술이다. 클라우드 환경에서 데이터 소유자는 자신이 생산한 데이터를 직접 등록해 판매하고, 분석가와 정보기술(IT) 개발자는 알고리즘 또는 인공지능(AI) 서비스를 개발해 배포한다. 일반 사용자는 구매한 데이터로 알고리즘을 실행시켜 시각화된 결과를 확인한다.

SODAS는 과학기술정보통신부 연구개발(R&D) 과제인 '국제표준 기반 오픈 데이터 유통 플랫폼 확장 기술 개발' 사업으로 개발됐다. 과제 초기에는 세계 공공기관에서 활용하고 있는 오픈 데이터 플랫폼 CKAN에 데이터 거래 기능을 추가, 한국데이터산업진흥원 데이터스토어를 구축했다. ETRI는 클라우드 환경에 최적화된 빅데이터 유통, 분석 플랫폼 SODAS를 자체 기술로 개발했다. 이 과정에서 빅데이터 생성·저장·가공·분석 등 빅데이터 카탈로그를 위한 메타데이터 요구 사항과 개념 모델이 국제표준으로 승인됐다.

SODAS는 기업이나 기관 데이터 유통에 대변화의 기회를 제공할 것으로 기대된다. SODAS는 700여개 웹API를 제공한다. 플러그인 구조로 시스템 기능 확장과 교체가 쉽다. 대기업부터 스타트업 등 기업과 기관은 SODAS를 이용, 비즈니스 모델을 반영한 데이터 유통 시스템을 신속하게 구축할 수 있게 된다.

ETRI는 데이터 산업 활성화를 위해 기반 기술 이전에 속도를 낸다. 이미 기술 이전을 받은 데이터누리는 금융보안원이 맡고 있는 데이터 거래소 구축에 SODAS 기술을 적용했다. ETRI는 최근 열린 소프트웨어(SW) 전시회 '소프트웨이브 2019'에 서비스를 전시, 대기업과 중소기업 등의 관심을 끌었다. 내년부터 기술 이전이 본격화될 것으로 예상한다.

원희선 ETRI 책임연구원은 “SODAS는 AI나 빅데이터 분석 효과를 보기 위해 갖춰야 하는 빅데이터 인프라 기술로, 구글이 베타 버전으로 공개한 데이터셋 서치 등과 경쟁하는 기술”이라면서 “앞으로 SODAS를 지능화해 더 편리하고 정확하게 데이터를 탐색하고, 저렴한 비용으로 데이터를 활용하도록 개발자 생태계를 조성하겠다”고 말했다.

김지선기자 river@etnews.com, 김영준기자 kyj85@etnews.com