[ET단상]디지털플랫폼정부 시대의 공공데이터 표준

이준환 전남대 국어국문학과 부교수·국어사학회 편집위원장
이준환 전남대 국어국문학과 부교수·국어사학회 편집위원장

우리의 하루하루의 삶은 데이터와 함께 시작된다고 해도 지나친 말이 아니다. 아침에 일어나 간밤에 들어온 국내외 뉴스를 확인하고, 그날의 날씨를 확인하여 옷차림을 어떻게 할지, 출근 방법과 출근 경로는 어떻게 하면 좋을지를 결정한다. 점심시간이 되면 인터넷에서 적절한 식당을 검색하여 고르고 어떻게 하면 그곳에 갈 수 있을지를 찾아본다. 이뿐만이 아니라 자동차나 부동산 관련 정보를 확인하거나, 퇴근 후에 즐길 취미 생활을 알아보거나, 명절이나 기념일 등에 식구나 은인들에게 줄 선물을 알아보기도 하고, 각종 기획을 할 때 참고가 될 만한 정보를 인터넷으로 찾아본다.

이처럼 우리 삶에 필요한 정보를 찾고, 거래하고, 소비하고, 생산하는 모든 일들의 바탕에 데이터와 데이터에 대한 검색이 자리 잡고 있다. 최근에는 인공지능(AI) 대화 서비스가 많은 주목을 받고 있는데, 이제는 데이터를 AI 언어 학습에 활용하게 되어 이전에는 상상할 수도 없었던 일들이 현실이 되어 가고 있다.

이와 같은 우리의 삶을 보면 데이터는 이미 오늘날 우리들의 문명을 이끌어가는 근간이 되었다고 하겠다. 각자의 경험과 아이디어가 데이터를 통해 서로 소통하고 결합하는 방식으로 실현되고 있고 새로운 가치를 만들어 내고 있다. 이런 상황이기에 데이터의 표준은 소통과 협업과 혁신을 이끄는 중요한 전제가 된다.

그중에서도 데이터에 쓰이는 용어는 가장 중요한 표준화 대상 가운데 하나이다. 데이터 용어를 표준화하면 같은 대상을 서로 다른 용어로 사용함으로써 생기는 비효율과 혼란을 줄이거나 막을 수 있으며, 상호 운용성을 높여 데이터의 다양한 활용이 이루어질 수 있다. 여러 데이터를 연계하여 활용하려면, 데이터 제공 기관과 활용 기관 사이에 데이터의 명칭, 유형(타입), 길이 등을 동일하게 맞추는 작업을 해야 할 필요가 있다.

그런데 이 작업은 생각보다는 번거로운 일이다. 더 나아가 여러 기관과 다양한 업무 목적으로 연계가 필요해지면, 더욱더 많은 밑 작업이 필요하고 그에 따른 시간과 비용이 늘어날 수밖에 없다. 데이터 표준이 있다면 이 과정은 쉽게 해결될 수 있을 것이다. 이것이 점차 늘어나는 데이터 융·복합 시대에 데이터 표준이 더욱 중요한 까닭이다. 따라서 데이터의 명칭, 유형, 길이 등을 표준화하는 작업은 번거로운 일이지만 미룰 수 없는 중요한 일이다.

데이터 표준은 범국가적으로 모든 기관이 동일한 기준과 원칙으로 사용하도록 행정안전부에서 '공통표준용어'로 제정하여 보급하고 있다. '공통표준용어'는 데이터를 구축할 때 컬럼(항목)의 명칭과 형식으로 활용할 수 있으며, 용어의 명칭을 나타내는 '표준 단어'와 형식(유형, 길이)을 나타내는 '표준 도메인'의 조합으로 만들어진다.

예를 들어 '작업 일자'란 말은 용어의 명칭을 나타내는 표준 단어인 '작업'과 '일자'가 결합된 형태이며, '일자'는 형식을 나타내는 표준 도메인을 포함하여 구성된 공통표준용어이다. 이것은 ㄱ 기관에서는 '작업일'로, ㄴ 기관에서는 '작업 일자'로, ㄷ 기관에서는 '작업 날짜'로 사용하던 용어를 '작업 일자'로 일원화한 것이다.

한국어화자인 우리에게 공통표준용어는 데이터를 이해하는 데에 많은 도움을 준다. 우리는 한국어로 언어·문화적 행위를 하므로, 외국어로만 표현된 데이터는 의미를 파악하고 응용하기에 어려움이 있기 때문이다. 예를 들어 네트워크에서 통신이 일어나는 과정을 단계로 나눈 '레이어명' 등의 어휘는 '계층명'이라는 공통표준용어로 순화하여 의미 이해를 돕고 있다.

이렇듯 데이터 표준은 우리 사회의 소통과 협업을 확대하고 데이터 이해에 도움을 주고 있으며 우리나라가 디지털플랫폼정부를 실현시키는 데에 밑거름이 될 것이다.

현재 공통표준용어는 여섯 차례 제정이 이루어졌고, 그 결과로 5300개의 공통표준용어를 공공데이터포털 등에서 제공하고 있다. 공통표준용어 제정에 협력하고 있는 국립국어원의 용어 보급 시스템인 '온용어'에서도 상반기 중 공통표준용어가 제공될 예정이다. 공통표준용어가 정부 및 공공기관의 데이터베이스 표준화 업무에 활용되고, 나아가 우리나라의 데이터 산업 성장에도 기여하도록 발전해나가길 바란다.

이준환 전남대 국어국문학과 부교수·국어사학회 편집위원장 mystery@chonnam.ac.kr