[CIO BIZ+]정부3.0 공공데이터 개방, 데이터 품질 제고가 우선

글자 작게 글자 크게 인쇄하기

정부가 오는 2017년까지 파급효과가 큰 기상·교통 등 공공데이터 15대 전략 분야를 선정, 집중적으로 개방을 추진한다. 단계적으로 공공데이터의 60%를 개방한다는 계획이다. 그러나 문제는 공공데이터의 활용이다. 현재 정부3.0 정책에 따라 다수 공공기관의 공공데이터를 개방하지만 활용도는 매우 낮다. 활용도가 낮은 가장 큰 원인은 데이터 품질 때문이다. 이러한 문제를 해결하기 위해 안전행정부가 공공데이터 품질 제고를 위해 두 팔을 걷어 붙였다.

[CIO BIZ+]정부3.0 공공데이터 개방, 데이터 품질 제고가 우선

◇공공데이터 품질관리지원센터 설립

정부3.0 정책에 따른 공공데이터 개방이 활성화되기 이전에는 데이터 평균 오류율이 5.19%에 이르렀다. 민간데이터 오류율이 2.1%인 것을 고려하면 두 배 이상 높은 수치다. 더욱이 데이터베이스(DB) 구조가 제대로 이뤄져 있는지를 의미하는 데이터 완전성 오류는 9.81%다. 공공기관의 데이터 품질관리 활동도 절반 가까이가 미흡했다.

안행부는 공공데이터 품질 관리를 위해 `공공데이터의 제공 및 이용 활성화에 관한 법률`을 마련해 법적 근거를 마련했다. 공공기관의 DB 품질관리 지침도 세웠다.

공공정보 품질관리지원센터를 설립, 품질관리 지원체계도 수립했다. 안행부와 한국정보화진흥원, 투이컨설팅은 8개월 동안 품질진단과 컨설팅, 품질관리 사업 지원, 품질교육과 홍보, 포털 운영 방안을 마련했다.

품질진단과 개선 컨설팅을 위해 중요 DB의 품질진단과 개선 계획을 수립하고 상담 컨설팅으로 기관 품질을 진단했다. 품질관리 사업 지원을 위해 기술 상담과 수요기관을 발굴하고 사업계획서 작성, 예산산정을 지원했다. 공공데이터 품질관리 문화 확산을 위해 품질관리 역량 강화 교육을 실시하고 홍보도 강화했다. 공공데이터 품질관리 포털 고도화도 추진했다. 공공데이터 개방 관리체계 강화 방안도 연구했다.

◇28개 기관 35개 공공DB 개선사업 지원

안행부와 한국정보화진흥원은 22일 `2013년 공공데이터 품질관리 지원사업`을 완료, 추진 성과 공유를 위한 보고회를 개최했다. 지난 9월부터 국정과제3.0의 핵심인 공공데이터 개방·활용을 위해 28개 기관 35개 공공DB를 대상으로 품질개선을 진행했다.

지원사업 대상기관은 데이터 품질진단을 수행, 개선 방안과 로드맵을 수립했다. 체계적인 데이터 품질관리를 할 수 있도록 규정·관리체계도 마련했다. 품질진단 결과 즉각적으로 효과를 낼 수 있으면 데이터 정제와 표준화, 성능 향상을 위한 개선작업도 수행했다.

주요 성과로는 법제처의 법령정보 DB 개선 지원사업이 있다. 법령·판례정보 등을 활용해 민간사업자가 관련 서비스를 개발, 새로운 가치 창출이 가능할 것으로 보인다. 대국민 법령정보 서비스 만족도 제고와 데이터 오류처리 등 관리비용 절감 등으로 27억원의 효과가 기대된다.

안행부의 범정부 전사아키텍처(EA)는 이번 사업으로 데이터 신뢰성을 확보, 1400개 공공기관의 공공정보 활용성을 제고했다. 데이터 입력자에 의한 반복적인 불량 데이터 입력관리를 위한 자동 정제 스크립트를 적용, 데이터 정제비용을 줄였다.

이밖에 경기도 버스DB, 국민권익위원회, 소방방재청, 한국환경공단 등 28개 기관 중 8개 기관이 10억원 이상 비용 절감효과를 얻었다. 김성렬 안행부 창조정부조직실장은 “공공데이터법 시행과 데이터 개방이 국가적인 주요 의제로 부상하면서 공공데이터 활용에 대한 인식이 크게 개선됐다”며 “공공데이터 품질 개선사업으로 품질체계가 선진화되도록 노력하겠다”고 말했다.

◇공공기관 품질관리 수칙 마련

안행부는 공공데이터 품질에 영향을 미치는 값·구조·표준·관리체계 4개 측면에서 공공기관들이 준수해야 할 핵심 품질관리 수칙을 마련, 제시했다.

수칙에 따르면 민간에 개방하는 데이터는 최신성, 정확성이 확보되도록 노력해야 한다. 오류로 인한 사용자의 불편을 최소화해야 한다. 중요 데이터는 입력 시 검증기능 강화 등으로 오류 데이터가 사전에 유입되는 것을 방지해야 한다.

데이터 모델은 데이터 중복을 최소화하도록 설계, 불가피한 중복 데이터는 일관성이 확보되도록 관리해야 한다. 데이터 모델 설계도 등 데이터 관련 산출물은 실제 데이터베이스와 일치하도록 관리·감독해야 한다.

기관 차원의 표준단어·표준용어·표준도메인·표준코드 등을 마련해야 한다. 데이터 품질관리를 위한 중장기 계획도 수립해야 한다. 제도적 근거와 세부절차, 담당자 지정도 도입해야 한다. 오류신고 관리와 성과평가도 뒤따라야 한다.

신혜권기자 hkshin@etnews.com

인터뷰 / 장광수 한국정보화진흥원장

-공공데이터 개방이 왜 중요한가.

▲공공정보화 추진으로 활용 가치가 높은 공공데이터가 많이 존재한다. 그러나 지금까지 관련 법령에 근거한 제한적 범위에서만 활용했다. 앞으로 공공데이터 개방을 적극 추진, 활용도를 높이는 것은 당연하다.

-공공데이터 활용을 높이기 위한 선행 과제는.

▲중요 전제조건은 데이터 품질이다. 품질 확보를 위해 기관이 보유한 데이터를 진단, 잘못된 부분을 고쳐야 한다. 데이터 품질이 일정하게 유지될 수 있도록 관리체계도 확립해야 한다. 데이터 품질관리 문화가 조성돼야 한다. 정부 차원에서도 제도 마련과 실질적인 지원체계를 갖춰야 한다. 공공데이터 활용지원센터는 종합적으로 품질관리를 지원하고 있다.

-공공기관이 가져야 할 자세는.

▲공공데이터는 국민의 자산이라는 것을 인식하고 수요자 관점에서 데이터를 제공, 활용할 수 있도록 해야 한다. 데이터 오류가 있으면 숨기지 말고 개선할 수 있도록 절차를 만들어 해결해야 한다. 보다 적극적인 자세로 데이터 품질 확보를 위해 노력해야 한다.

-공공데이터 활용 가치는 무엇인가.

▲EU는 2011년 공공데이터 개방으로 27개국에서 400억유로의 효과가 있을 것이라고 발표했다. 2012년 KAIST는 국내 공공데이터 활용으로 연간 24조원의 경제가치와 15만명의 고용효과가 있다는 조사결과를 발표하기도 했다..