생성AI 도입이 기업 전반으로 확산되면서 단순 기술 도입을 넘어 실제 성과로 연결하는 AX(AI Transformation)가 핵심 과제로 부상하고 있다. 2023년 5% 미만이던 엔터프라이즈 생성형 AI 도입률은 2026년 80%를 돌파할 것으로 예측되며, 기업들은 AI 도입 여부가 아닌 성공적인 활용 방안을 고민하는 단계로 전환되고 있다.
특히 내부 데이터를 활용해 맞춤형 결과를 도출하는 구축형 AI가 확대되면서 데이터 관리 역량이 AI 성능을 좌우하는 핵심 요소로 부각되고 있다. 생성형 AI는 학습 데이터의 품질에 따라 결과 정확성과 신뢰도가 결정되며, 데이터 관리 수준이 낮을 경우 AI 성능 저하와 보안 리스크가 동시에 발생할 수 있다.
또한 생성AI 언어 모델의 알고리즘 특성상 최적의 학습 데이터는 일반 텍스트형 데이터이며, 조직 내 텍스트 데이터의 90% 이상이 문서 형태로 존재한다. 이에 따라 문서를 포함한 비정형 데이터 관리 역량이 AI 경쟁력 확보의 핵심 요소로 자리잡고 있다.
파수의 '랩소디(Wrapsody)'는 생성AI 시대 차세대 문서관리 플랫폼이다.
성공적인 AI 활용을 위해 필요한 데이터 관리 역량은 ▲조직 데이터의 자산화 ▲버전 관리 및 ROT(Redundant, Obsolete, Trivial: 중복·불필요·구식 데이터) 관리 ▲민감정보 보호를 위한 권한 관리로 구성된다.
랩소디는 문서 자산화, 버전 및 ROT 데이터 관리, 파일 단위 권한 제어 기능을 통해 AI 학습에 필요한 데이터의 품질과 가용성을 동시에 확보한다. 모든 문서는 암호화되며, 문서가상화 기술을 기반으로 분산 저장 환경에서도 중앙에서 통합 관리된다.
이를 통해 중복 데이터와 구버전 데이터를 제거하고 효율성·경제성·보안성을 동시에 확보한 AI 학습 최적 데이터 환경을 제공한다.

랩소디의 핵심 기술인 문서가상화(Document Virtualization)는 각 문서에 고유 콘텐츠 ID를 부여하고, 문서 생성 및 유통 과정에서 발생하는 로컬 문서(Localized Copy)가 기준 문서(Reference Copy)를 참조하도록 설계된 구조다. 이를 통해 다양한 디바이스와 저장 위치에 분산된 문서라도 하나의 가상 콘텐츠로 통합 관리되며, 물리적 복제본이 존재하더라도 논리적으로는 단일 문서로 운영된다.
또한 문서에는 버전 정보, 접근 권한, 사용 이력, 태그 등 메타데이터가 함께 유지되며 데이터 일관성과 추적성을 확보한다. 이 구조는 AI 학습 환경에서 단일 진본 데이터만을 공급하는 '싱글 소스 오브 트루스(Single Source of Truth)'를 구현해 데이터 신뢰성을 높인다.
랩소디는 문서 자체에 권한을 부여하는 구조를 통해 AI 활용 과정에서도 실시간 접근 통제를 수행한다. RAG(Retrieval-Augmented Generation) 환경에서 AI가 내부 데이터를 활용해 답변을 생성할 때, 시스템은 질문자의 문서 열람 권한을 실시간으로 검증한다. 권한이 없는 문서는 데이터 수집 단계뿐 아니라 LLM의 답변 조합 과정에서도 자동으로 제외된다.
이를 통해 AI 응답 결과에 비인가 데이터가 포함되는 것을 원천적으로 차단하며, 민감정보 유출 위험을 최소화한다.
랩소디는 자동 동기화(Automated Synchronization) 기능을 통해 원본 문서 변경 시 AI 데이터베이스를 실시간으로 갱신한다. 이 과정은 관리자 개입 없이 백그라운드에서 수행되며, AI 학습 및 응답에 항상 최신 데이터가 반영된다. 이를 통해 데이터 최신성과 정확성을 유지하며 AI 결과 품질을 지속적으로 확보할 수 있다.
랩소디는 다양한 산업군에서 도입되어 활용되고 있으며, 공공기관 A는 문서 현황을 통합적으로 파악하고 안전하게 보호하면서도 문서 생성 및 활용에 제한이 없는 환경을 구축하기 위해 랩소디를 도입했다.
해당 기관은 문서가상화 기반 구조를 통해 저장 위치와 무관하게 문서를 사용할 수 있는 환경을 구현했으며, 문서 자체 암호화를 적용해 비인가 접근을 차단했다. 또한 실시간 백업 기능을 통해 랜섬웨어 대응 체계를 마련했다.
나아가 내부 AI 시스템과 연동해 중복 없는 최신 데이터를 기반으로 AI 학습 효율성과 결과 품질을 향상시켰으며, 데이터 권한 정책을 연동해 AI 결과물이 사용자 권한에 맞는 정보만 포함하도록 구현했다.
파수는 랩소디와 함께 AI 기반 개인정보보호 솔루션 'AI-R Privacy'와 민감정보 관리 솔루션 'AI-R DLP'를 함께 선보였다.
AI-R Privacy는 NLP, OCR, 딥러닝 기술과 트랜스포머 기반 언어 모델을 활용해 복잡한 문서에서도 개인정보를 정확하게 검출하고 마스킹할 수 있다. 해당 솔루션은 GS 인증을 획득했으며, 대법원 형사전자소송추진단 사업 등 공공 영역에서 활용되고 있다.
또한 공공기관에서는 AI 학습 데이터에서 개인정보를 제거하기 위해 방대한 연구 데이터를 비식별 처리하는 용도로 활용되고 있다.
AI-R DLP는 서비스형 AI 사용 과정에서 프롬프트 입력 및 첨부파일을 모니터링해 개인정보, 영업기밀, 핵심 기술 등 민감정보 유출을 방지한다. 자연어 기반 분석을 통해 정형 규칙이 아닌 문맥 기반으로 정보를 검출하며, 공공기관 N2SF 정책에 따른 데이터 식별도 지원한다.
파수는 문서 중심 데이터 관리에서 시작해 AI 학습 데이터 관리, 개인정보 보호, 민감정보 통제까지 확장된 통합 데이터 거버넌스 전략을 지속적으로 강화할 계획이다.
특히 데이터 품질, 보안, 권한 통제, 자동화 기능을 통합 제공하는 플랫폼으로 발전시켜 기업이 안전하고 효율적으로 생성AI를 활용할 수 있는 기반 인프라로 자리매김한다는 방침이다.
이처럼 파수의 Wrapsody와 AI 보안 솔루션은 데이터 자산화부터 보안, AI 활용까지 전 과정을 통합 관리하는 구조를 통해 GenAI 시대 기업 데이터 전략의 핵심 인프라로 확장되고 있다.
[알림] 'GTT KOREA'와 '전자신문인터넷'이 공동으로 오는 3월 26일 웨스틴 서울 파르나스 호텔에서 주최하는 “DISS(Data Insight & Security) 2026”에서는 “데이터와 AI 통합, 비즈니스 혁신 중심에 서다”를 주제로 글로벌 테크 기업과 전문가들이 데이터 인사이트(Data Insight), 데이터 관리(Data Management), 데이터 보안(Data Security) 등 최신 기술 동향과 산업 사례, 실무 적용 전략을 공유하고 전시 부스가 마련되어 각 솔루션을 직접 체험해 볼 수 있는 기회가 제공된다.
임민지 기자 minzi56@etnews.com