
생성형 인공지능(AI) 도입이 빠르게 확산되고 있지만, 기업 현장에서는 기대만큼 성과를 내지 못하는 사례가 빈번한 가운데 AI 활용의 성패는 AI 준비 데이터가 성패가 달렸다는 주장이 제기됐다.
지능형 데이터 플랫폼 전문기업 데이터스트림즈(대표 이영상)는 AI 활용의 성패를 가르는 핵심 요소로 'AI-레이디 데이터(Ready data)'를 제시하며 시장 적용을 확대하겠다고 28일 밝혔다.
데이터스트림즈에 따르면 현재 기업 AI 프로젝트의 상당수는 데이터 불일치, 출처 불명확, 최신성 부족 등 기초 데이터 문제로 인해 실제 활용 단계에서 한계를 안고 있다.
특히 최근 확산되는 '에이전트 AI'는 단순 질의응답을 넘어 판단과 실행까지 수행하는 구조로 발전하면서 AI가 활용하는 데이터의 정합성과 신뢰성 확보가 핵심 경쟁 요소로 부상하고 있다고 했다.
데이터스트림즈는 이러한 환경에서 요구되는 데이터 상태를 “AI가 바로 활용할 수 있도록 정제·연결·통제된 데이터”, 즉 AI-Ready Data로 규정했다.
AI-Ready Data 구현을 위해서는 기존과 같은 데이터 저장·통합 중심 접근을 넘어 데이터의 흐름과 의미, 품질을 통합적으로 관리하는 구조가 필요하다.
이에 데이터스트림즈는 데이터 가상화 기반 통합 접근과 메타데이터 중심 거버넌스를 결합한 데이터 패브릭(Data Fabric) 아키텍처를 기반으로 AI-Ready Data를 구현하고 있다.
해당 구조는 크게 세 가지인 연결(Connectivity), 의미 (Semantics), 통제 (Governance)가 있다. 먼저 분산된 데이터를 물리적 이동 없이 실시간으로 연결하여 데이터 사일로를 제거하고 통합 접근 환경을 구현하는 것이다. 또 메타데이터를 기반으로 데이터의 비즈니스 의미와 관계를 정의하여 AI가 동일한 기준으로 데이터를 이해하도록 지원한다. 통제와 관련해선 데이터 계보(Lineage)와 품질 규칙을 기반으로 데이터 흐름과 상태를 지속적으로 관리하여 AI 입력 데이터의 신뢰성을 확보해야 한다고 했다.
데이터스트림즈는 가상화 엔진 SuperQuery와 메타데이터 플랫폼 MetaStream을 기반으로 이러한 구조를 구현하고 있다.
특히 이 구조에서는 AI가 사용하는 모든 데이터에 대해 출처, 변환 과정, 품질 상태를 추적할 수 있어 AI 결과의 설명 가능성(Explainability)까지 확보할 수 있다는 설명이다.
이러한 전략은 최근 한국지능정보사회진흥원 세미나 등에서도 공유되었으며, 에이전트 AI 시대 데이터 인프라 방향으로 논의되고 있다.
데이터스트림즈는 현재 금융권 중앙회, 공공기관, 대형 서비스 기업 등을 중심으로 AI-Ready Data 기반 데이터 거버넌스 체계 적용을 확대하고 있다.
데이터스트림즈 이영상 대표는 “AI가 기대만큼 성과를 내지 못하는 이유는 대부분 데이터가 준비되지 않았기 때문”이라며 “앞으로 AI 경쟁력은 모델이 아니라 AI-Ready Data를 얼마나 빠르게 구축하느냐에서 결정될 것”이라고 강조했다.
데이터스트림즈는 향후 AI-Ready Data 전략을 중심으로 에이전트 AI 시대에 대응하는 데이터 인프라 사업을 확대해 나갈 계획이다.
이경민 기자 kmlee@etnews.com