AI 기본법 시대…데이터스트림즈, 데이터 리니지 기반 AI 거버넌스 전략 제시

기업 데이터 80%가 비정형… AI 프로젝트 87% 실패 근본 원인 해결

AI 기본법 시대…데이터스트림즈, 데이터 리니지 기반 AI 거버넌스 전략 제시

지능형 데이터 플랫폼 전문기업 데이터스트림즈(대표 이영상)는 지난 26일 'AI 거버넌스와 데이터 리니지-비정형 데이터를 AI 자산으로 전환하라'를 주제로 웨비나를 개최하고, 비정형 데이터를 AI 자산으로 전환하는 구체적인 방법론과 솔루션을 제시했다.

이번 웨비나는 2026년 1월 시행된 AI 기본법 이후 기업이 요구받고 있는 AI 투명성, 안전성, 책임성 확보를 위한 대응 방안을 중심으로 진행됐다. 기업 내 방대한 비정형 데이터가 AI 활용의 핵심 자산이 될 수 있음에도, 관리 체계 부재로 인해 실제 활용에는 한계가 있다는 점이 주요 문제로 제기됐다.

데이터스트림즈는 발표를 통해 AI 도입 실패 근본 원인이 기술이나 예산이 아닌 '데이터 거버넌스 부재'에 있다고 진단했다. 대부분 기업이 문서, 이메일, 이미지 등 다양한 비정형 데이터를 보유하고 있지만 이를 체계적으로 관리하지 못하면서 AI 모델 신뢰성과 품질 확보에 어려움을 겪고 있다는 설명이다.

데이터스트림즈의 독자 아키텍처인 M-DOSA(Meta Data Oriented Service Architecture)가 주목을 받았다. M-DOSA는 메타데이터 카탈로그를 모든 데이터 서비스 중심에 두는 설계 철학으로, 비정형 문서에서 추출된 필드와 정형 데이터베이스 컬럼을 카탈로그 매핑 테이블로 연결한다. 이를 통해 종이 신청서에서 출발한 데이터가 SQL 파이프라인을 거쳐 AI 모델에 이르기까지 전 과정을 하나의 리니지 캔버스에서 끊김 없이 추적할 수 있다.

이날 웨비나에서는 데이터스트림즈의 Q-Track AI를 기반으로 비정형 데이터를 AI 자산으로 전환하는 구체적 방법이 시연됐다. 시연에서는 비정형 문서 업로드→OCR 기반 자동 구조화→AI 개인정보 자동 탐지→데이터 스튜어드 최종 승인(Human-in-the-Loop)→ODS에서 AI 모델까지 전 구간 리니지 자동 생성의 4단계 파이프라인이 소개됐다. 개인정보 자동 탐지와 함께 주민등록번호 등 복원 불가 항목에 대한 단방향 해싱, 감사 목적 복원이 필요한 항목에 대한 양방향 암호화 등 비식별화 자동 적용 기능이 공개됐다.

아울러 데이터 생성부터 활용까지의 흐름을 노드 그래프로 시각화해 전사 데이터 이동 경로를 추적할 수 있는 데이터 리니지 체계를 통해 AI 기본법 컴플라이언스 대응이 가능하다는 점도 강조됐다. 기존에 수일에서 수주가 소요되던 감사 소명 작업을 Q-Track AI를 통해 1분 이내에 자동 생성할 수 있다는 점 역시 참석자들의 주목을 받았다.

발표를 맡은 곽두일 데이터스트림즈 AI전략사업본부 AI개발팀 수석은 17년간 공공·금융·의료·제조 등 다양한 산업 영역에서 40건 이상 엔터프라이즈 AI PoC를 수행한 경험을 바탕으로, 비정형 데이터를 정형 데이터 수준으로 관리해 AI 신뢰성과 활용도를 동시에 높이는 방법론을 시연했다. 그는 기업이 보유한 비정형 데이터를 정형 데이터 수준으로 관리할 수 있을 때 AI 신뢰성과 활용도가 함께 향상될 수 있다고 설명했다.

데이터스트림즈는 이번 웨비나를 통해 AI 경쟁력의 핵심이 모델이 아닌 데이터 관리 역량에 있음을 강조하며, 준비된 기업과 그렇지 않은 기업 간 격차는 향후 더욱 확대될 것으로 전망했다.

이영상 데이터스트림즈 대표는 “AI 기본법이 시행된 지금, 데이터 거버넌스 없이 기업용 AI를 운영하는 것은 더 이상 선택의 문제가 아니다”라며 “비정형 데이터를 AI 자산으로 전환하는 M-DOSA 기반 AI 거버넌스가 2027년 기업 AI 경쟁력의 핵심 기준이 될 것” 이라고 밝혔다.

김현민 기자 minkim@etnews.com