![코스탯-디아이디 실행 화면.[통계청 제공]](https://img.etnews.com/news/article/2025/09/04/news-p.v1.20250904.820f303988b049ff8a006c44bdafda2d_P1.jpg)
국가통계를 공개할 때 개인정보가 유출되는 사고를 사전에 차단하는 프로그램이 보급된다.
통계청은 '코스탯-디아이디'(KOSTAT-Did)를 개발해 437개 국가통계작성기관을 대상으로 서비스한다고 4일 밝혔다.
이 프로그램은 마이크로데이터의 개인정보 노출 위험을 평가하고 특정 개인 또는 사업체를 식별할 수 없도록 자동 처리한다.
최근 AI 대전환 시대를 맞이해 AI 학습용으로 국가통계 상세 자료 제공 요구가 증가하고 있다. 데이터가 상세할수록 유용성은 커지지만 그만큼 개인정보 노출 위험도 함께 증가한다. 사람이 비식별화 작업을 할 경우 인적 오류 가능성이 있어 통계 작성기관들은 자료 제공에 소극적으로 대응해왔다.
통계청은 지난 2023년 '비식별화 가이드라인'을 배포했으며 지난해에는 수작업으로 처리해 온 비식별화 업무를 지원하기 위해 엑셀 기반 KOSTAT-Did를 개발했다. 이후 외부 기관 실무자와 전문가 테스트를 거쳐 최종 프로그램을 확정했다. KOSTAT-Did는 통계정책관리시스템을 통해 제공된다. 10월부터는 통계작성기관 대상 맞춤형 사용자 교육도 실시할 예정이다.
KOSTAT-Did는 삭제, 마스킹, 범주화 등 15종의 다양한 비식별화 방식과 처리 전후 정보손실도와 노출 위험도를 시각화한 그래프를 제공한다. 통계 담당자는 이를 토대로 통계 담당자는 최적의 마이크로데이터 공개 범위를 설정할 수 있게 된다.
안형준 통계청장은 “3대 AI 강국 도약을 위해서는 양질의 데이터인 국가통계를 안전하게 개방할 수 있는 인프라 지원이 필요하다”며 “통계청의 프로그램 보급을 계기로 국가통계작성 기관이 더 많은 데이터를 손쉽고 안전하게 개방할 수 있도록 지원하겠다”고 말했다.
최다현 기자 da2109@etnews.com