[ET시론]통계정보플랫폼이 가져올 더 나은 미래

[ET시론]통계정보플랫폼이 가져올 더 나은 미래

2025년은 인구총조사가 실시된 지 100년이 되는 해다. 1925년 일제하에서 '국세(國勢)조사'라는 이름으로 처음 근대적 인구총조사가 시행됐고, 이후 5년 주기로 인구총조사를 실시하고 있다. 인구총조사 조사항목은 그 당시의 관심사를 반영해 1925년 5개로 시작돼 2020년에는 56개로 크게 확대됐다.

초기 인구총조사에서 눈에 띄는 항목이 문맹 여부다. 인구총조사가 두 번째로 시행됐던 1930년부터 조사됐던 항목으로, 국민의 교육 정도를 파악하기 위해 단순히 읽고 쓰는 능력에 관한 질문이 포함됐다. 조사 결과를 보면 1930년에는 문해율이 23.6%에 불과했는데, 1960년에는 72.1%로 증가했다. 마지막으로 조사됐던 1985년에는 94.6%로 증가함에 따라 조사 필요성이 낮아져 1990년부터 조사항목에서 빠지게 됐다.

과거에는 단순히 글자를 읽고 쓰는 능력이 중요했다면 지금은 필요한 데이터를 찾고 활용하는 능력이 중요한 시대가 됐다. 4차 산업혁명 시대에 가장 중요한 '데이터'를 제대로 활용하지 못하는 사람을 '데이터 문맹'이라고까지 하고 있다.

최근 챗GPT의 등장으로 세상이 시끄럽다. 공상과학으로 생각하던 영역이 어느덧 성큼 현실로 다가온 느낌이다. 몇 가지 키워드만으로 기고문 하나를 뚝딱 생성해내는 인공지능(AI) 능력을 보면 인간의 영역이 점차 사라지는 게 아닐까 하는 걱정마저 든다.

하지만 이러한 AI 능력은 어느 날 하늘에서 떨어진 것이 아니다. 고성능 AI 기술이 실현되기 위해서는 그 이면에 학습에 활용하기 위한 방대한 데이터 기반이 먼저 존재해야 한다. 챗봇, 음성인식, 자율주행 등 어떤 종류의 AI에도 예외는 없다. 인간이 경험과 학습을 통해 똑똑해지듯 AI 역시 데이터 품질과 양에 의해 발전한다. 결국 모든 것은 데이터로 귀결된다.

데이터는 AI뿐만 아니라 국가는 물론 기업과 개인의 경쟁력을 결정하는 혁신 성장동력으로 떠오르고 있다. 이러한 사회 변화에 발맞춰 기업은 데이터와 AI를 활용해 세분된 마케팅 전략을 수립하고 맞춤형 서비스를 제공하고 있고, 정부는 '모든 데이터가 연결되는 디지털플랫폼 정부' 구현을 통해 국가 차원의 데이터 활용 기반을 마련하고자 노력하고 있다.

그러나 아직도 각 기관이 가지고 있는 데이터에 대한 접근이 제한돼 데이터 활용은 전문가만의 영역으로 한정돼 있다. 데이터는 규모가 커질수록 가치가 증가하는 '규모의 경제'와 데이터 속성 간 결합이 다양할수록 가치가 배가되는 '범위의 경제'라는 특성이 있다. 이를 고려할 때 데이터 가치 향상을 위해서는 데이터 결합과 연계가 필수다. 하지만 현실은 기관 간 칸막이로 인한 데이터 입수의 어려움과 개인정보 등 민감한 데이터 노출 우려에 따른 접근 제한으로 데이터 활용과 분석이 대중화되기는 쉽지 않은 상황이다. 통계 데이터의 허브이자 공신력 있는 중개자로서 통계청의 역할이 필요해지는 시점이다.

데이터 자산의 대중적 활용을 촉진하기 위해서는 데이터 연계 활용 강화와 민감정보 보호 기능을 동시에 갖춘 허브 플랫폼 구축이 필요하다. 누구나 필요한 통계 데이터를 입수해 활용할 수 있어야 하며, 그 과정에서 어떠한 방식으로도 데이터가 노출되거나 왜곡되지 않아야 한다. 이에 더해 분석 결과를 통해 더 나은 사회를 만드는 것에 공헌할 수 있어야 한다. 이것이 바로 통계청이 '통계정보플랫폼 및 원포털' 사업을 통해 구현하고자 하는 가치다.

통계청은 2023년 통계정보플랫폼 및 원포털을 위한 BPR·ISP 사업을 추진하고 있다. 이 사업은 통계생산, 분석, 서비스 모든 단계를 아우르는 통계데이터 거버넌스 및 원포털 통계정보서비스를 구축하는 사업으로 2024년 예비타당성조사를 수행 후 2025~2028년 4개년에 걸쳐 정보시스템 마스터플랜 수립(ISMP)·설계·구축을 추진할 예정이다.

사업의 주요 산출물 중 하나인 '통계데이터 허브플랫폼'은 모집단 데이터인 통계등록부를 중심으로 다양한 기관에 흩어진 데이터를 연계한다. 각 기관의 통계 데이터를 통합해 조회할 수 있는 통계 데이터 카탈로그와 활용 요청에 따라 각 기관 시스템에 접근해 권한 승인을 받아 데이터를 추출할 수 있는 표준화된 접근 경로를 제공할 것이다. 한편 입수가 어려운 통계 데이터에 대한 중개역할을 통계청이 수행함으로써 기존에 전문가들로 한정돼 있던 데이터 분석 영역이 일반 대중에게 확대되도록 기여하고자 한다.

통계정보플랫폼 및 원포털 사업에서는 이에 더해 최신 AI 기술을 적극 활용, 보다 지능화된 통계 활용 환경을 제공하고자 한다. AI 도움을 받아 주제에 따라 활용할 데이터를 추천해주는 시스템이 대표적이다. 기존 목적에 맞는 데이터 위치와 특징을 파악하기 위해 전문가 도움을 받거나 개인 시간을 투자해 학습해야 했던 상황을 앞으로는 데이터 도우미를 활용해 원클릭으로 편리하게 해결할 수 있을 것이다.

뿐만 아니라 자연어를 활용한 지능형·대화형 검색으로, 누구나 쉽고 편리하게 통계정보에 접근할 수 있게 할 것이다. 이에 더 나아가 대화형 질의에 답해 활용 자료를 실시간으로 생성할 수 있는 통계GPT까지, 통계정보플랫폼의 발전 영역은 무궁무진하다.

미래의 국력은 데이터 자산을 얼마나 확보할 것이냐에 달려 있다고 한다. 지능화되고 현대화된 통계정보플랫폼으로 인해 데이터 자산이 풍성해지고 분석이 대중화되면 어느 순간 데이터 활용 부가가치가 수직 상승하는 시점이 오게 될 것이다. 이 시점을 앞당기기 위해 정부가, 통계청이 무엇을 할 수 있을지 넓은 시야를 가지고 노력해야 할 것이다.

한훈 통계청장

〈필자〉
한훈 통계청장은 서울대 경영학과를 졸업하고 미국 워싱턴대에서 경제학 박사학위를 취득했다. 행정고시 35회로 공직에 입문해 기획재정부 정책조정국장, 경제예산심의관, 차관보를 지냈다. 경제정책·예산분야 요직을 거치며 다양한 업무 경험과 꼼꼼한 일 처리가 장점으로 꼽힌다. 평소 격의 없는 소통으로 기재부 직원이 선정한 닮고 싶은 상사에 3회 선정돼 '명예의 전당'에 올랐다. 현재는 19대 통계청장으로서 국민중심 국가통계혁신으로 통계청의 도약을 이끌고 있다.

[ET시론]통계정보플랫폼이 가져올 더 나은 미래