
최근 공공기관, 기업에서 전자문서를 활용한 정보 공개가 급증하면서 개인정보 유출 리스크가 커지고 있다. 그러나 기존의 마스킹 방식은 사람이 일일이 수작업으로 검토하거나 단순 패턴(정규표현식) 매칭에 의존해 오탐과 누락의 한계가 지속적으로 제기돼 왔다.
이런 문제를 해결하기 위해 AI 기반 솔루션 전문기업 씨지인사이드(대표 박선춘)는 대형언어모델(LLM)을 활용해 문서 내 개인정보를 정확히 식별하고 맞춤형 마스킹을 제공하는 LLM 기반 맞춤형 개인정보 마스킹 시스템 특허를 취득했다고 25일 밝혔다.
이번 특허 시스템은 단순 문자열 검색을 넘어 LLM이 텍스트의 문맥과 의미를 깊이 있게 파악하는 것이 특징이다. 동명이인이나 다양한 포맷으로 작성된 날짜, 연락처 등 기존 방식으로는 걸러내기 어려웠던 개인 식별 정보를 유연하게 구분해, 탐지 신뢰도 점수를 함께 제공하여 더욱 정확한 비식별화를 돕는다.
씨지인사이드 해당 마스킹 시스템은 다음과 같은 3대 핵심 기술을 기반으로 한다. 첫째, LLM 기반 문맥 분석 탐지 기능으로 규정된 패턴 외에도 문맥상 개인정보를 정밀하게 추론한다. 둘째, 문서 원본 레이아웃 보존 재구성 기술을 통해 HWP, DOCX, PDF 등 파일 형식의 서식과 표 구조, 좌표를 유지하면서 마스킹 영역만 덮어쓴다. 셋째, 사용자 맞춤형 편집 엔진을 통해 마스킹 강도, 색상, 아이콘 등을 기관별 보안 정책에 맞게 설정할 수 있다.
박선춘 씨지인사이드 대표는 “개인정보 보호법 및 글로벌 데이터 보호 규제(GDPR)가 강화되는 가운데, 기업·기관 보안 문서 처리는 더 이상 수작업으로 감당하기 어려운 수준에 이르렀다”며 “이번 특허 기술을 통해 대용량 문서 비식별화 전 과정을 자동화함으로써 누구나 안심하고 데이터를 개방하고 공유할 수 있는 새로운 보안 표준을 제시해 나가겠다”고 밝혔다.
씨지인사이드는 이번 LLM 기반 개인정보 마스킹 시스템 외에도 금융기관에 특화된 내규 기반 Compliance 지원 AI 시스템을 IBK기업은행 등에 적용한 바 있으며, 지방의회 예산결산분석 AI 시스템, 국회 법률안 실시간 모니터링 AI 시스템, 의료기관 보험청구 지원 AI 시스템을 SaaS 서비스로 잇달아 출시하며 국내 리걸테크 시장을 빠르게 공략하는 중이다.
씨지인사이드는 AI 기반 정책·규제 데이터 분석 기술을 바탕으로 다양한 공공 및 금융기관 대상 서비스를 확장하고 있으며, 2025년 초격차 DIPS 1000+ 기업 선정, K-디지털 그랜드 챔피언십 우수상을 수상하며 기술력과 사업성을 인정받았다.
김현민 기자 minkim@etnews.com