기업의 AI 도입이 실험 단계를 넘어 실제 업무 자동화와 의사결정 지원 단계로 확산되면서 데이터 인프라 전략 역시 저장 중심 구조에서 통합 데이터 활용 구조로 빠르게 전환되고 있다. 특히 생성AI와 AI 에이전트 환경에서는 정형·비정형·멀티모달 데이터를 동시에 연결하고, 데이터 계보 추적과 접근 통제, 거버넌스 기반 관리까지 포함하는 통합 데이터 관리 체계가 핵심 경쟁력으로 부상하고 있다. 이에 따라 기업들은 데이터 인사이트, 데이터 관리, 데이터 보안을 하나의 흐름으로 연결하는 플랫폼 중심 전략을 확대하고 있다.

또한 멀티클라우드, SaaS, 쿠버네티스, 프라이빗 클라우드, 오브젝트 스토리지 환경이 동시에 운영되는 구조가 일반화되면서 데이터 보호와 품질 관리, 분석 활용을 분리해 운영하던 기존 방식은 한계를 보이고 있다. 최근에는 레이크하우스(Lakehouse) 아키텍처, 문서 기반 비정형 데이터 관리, 합성데이터 생성, 제로 트러스트 데이터 복원력, 벡터 검색 기반 생성AI 데이터 활용 등 다양한 기술이 통합 데이터 전략의 핵심 요소로 자리잡고 있다.
DISS 2026에서 차세대 데이터 전략으로 제시된 데이터 활용 범위와 운영 안정성을 동시에 확보할 수 있는 AI 시대에 최적화된 데이터 지능형 통합 인사이트·관리·보안 솔루션을 만나보자.
[데이터보안]
기업 데이터 환경이 가상화 인프라, 데이터베이스, 파일 시스템, 쿠버네티스 기반 컨테이너, 퍼블릭 클라우드 오브젝트 스토리지까지 확장되면서 데이터 보호 방식도 단일 백업 중심 구조에서 정책 기반 보호 관리와 장기 보관, 변경 불가 보호, 격리 복구를 포함하는 통합 데이터 보호 아키텍처 중심으로 전환되고 있다. 델 테크놀로지스는 이러한 변화에 대응해 파워프로텍트(PowerProtect) 포트폴리오 기반 통합 데이터 보호 구조를 제시하고 있다.
파워프로텍트 데이터 매니저(PowerProtect Data Manager)는 가상화 환경, 데이터베이스, 파일 시스템, 컨테이너 환경 등 다양한 워크로드에 대해 정책 기반 보호를 중앙에서 관리할 수 있도록 설계된 보호 관리 소프트웨어다. 인스턴트 액세스 기능을 통한 빠른 복구 지원과 애플리케이션 일관성 기반 보호 구조를 제공하며 쿠버네티스 네임스페이스 및 퍼시스턴트 볼륨 클레임 단위 보호 정책 적용을 통해 클라우드 네이티브 환경까지 보호 범위를 확장한다.
파워프로텍트 데이터 도메인(PowerProtect Data Domain)과 사이버 리커버리(PowerProtect Cyber Recovery)는 중복 제거 기반 저장 구조와 볼트 기반 격리 복제 구조를 통해 랜섬웨어 대응 중심 보호 체계를 지원한다. 클라우드 티어와 리텐션 락 기능을 활용한 오브젝트 스토리지 기반 장기 보관과 변경 불가 보호 정책 적용도 가능하며 금융, 공공, 제조, 의료 등 규제 대응과 장기 보존 요구가 높은 산업 환경에서 활용 가능한 통합 데이터 보호 플랫폼으로 제시된다.

브로드컴(Broadcom)의 VCF(VMware Cloud Foundation)는 프라이빗 클라우드 환경에서 보안, 규제 준수, 사이버 복구 기능을 통합 제공하도록 설계된 플랫폼이다. 글로벌 기업의 데이터 보호 규제 대응과 랜섬웨어 대응 요구가 동시에 확대되는 환경에서 인프라 전반의 보안을 내재화하고 제로 트러스트 기반 보호 체계를 단일 플랫폼에서 구현하도록 지원한다. 또한 안전한 격리 복구 환경까지 포함해 사이버 레질리언스를 강화하는 구조를 제공한다.
VCF는 어드밴스드 사이버 컴플라이언스 기능을 통해 규제 준수 상태를 지속적으로 모니터링하고 위반 사항을 자동 교정하도록 지원한다. SaltStack 기반 자동화 기능을 활용해 인프라 설정 상태를 점검하고 규제 대응 사각지대를 줄일 수 있도록 설계됐다. 동시에 클린룸 기반 격리 복구 환경을 자동화해 랜섬웨어 발생 시 감염되지 않은 데이터로 신속하게 복구할 수 있도록 지원하며 VM 네트워크 격리도 원버튼 방식으로 수행할 수 있다.
또한 VMware v디펜드는 컴퓨팅·스토리지·네트워크 전 계층에 제로 트러스트 보안을 적용하고 NDR 센서를 통해 데이터센터 트래픽을 분석해 위협을 조기에 탐지하도록 지원한다. VMware Avi Load Balancer는 웹 애플리케이션 보호 기능과 함께 NIST 양자 내성 암호 알고리듬 지원, mTLS 기반 서비스 간 통신 보호, MCP 트래픽 보호 기능까지 제공해 AI 워크로드와 클라우드 애플리케이션 보안 수준을 강화한다.

[데이터 지능형 통합 인사이트]
피지컬 AI(Physical AI)는 로봇, 자율주행, 스마트팩토리, 디지털 트윈 등 실제 물리 환경에서 작동하기 때문에 영상·센서·환경 정보 등 다양한 멀티모달 데이터를 동시에 활용한다. 이 과정에서 데이터 부족, 편향, 결손, 시뮬레이션과 현실 간 격차(Sim-to-Real Gap) 등 데이터 병목 문제가 AI 모델 정확성과 안전성 확보의 핵심 과제로 부상하고 있다. 이러한 환경에서는 데이터 품질 관리 체계 구축이 피지컬 AI 경쟁력의 핵심 요소로 평가된다.
페블러스의 '에이전틱 데이터 클리닉(Agentic Data Clinic)'은 기업이 보유한 데이터를 분석해 중복·편향·결손 데이터를 자동 식별하고 데이터 경량화와 합성데이터 생성까지 수행하는 데이터 품질 관리 플랫폼이다. 데이터 분포 분석, 품질 진단, 데이터 최적화 기능을 하나의 플랫폼에서 통합 제공하며 데이터 거버넌스 관리까지 포함해 데이터 운영 전 과정을 체계적으로 지원하는 것이 특징이다.
또한 디지털 트윈 기반 합성데이터 생성기 '페블로심(PebbloSim)'과 자율형 AI 데이터 사이언티스트 플랫폼 'AADS'를 결합해 데이터 수집부터 품질 진단, 개선, 생성, 규제 대응 보고까지 자동화하는 데이터 파이프라인 전략을 제시한다. 이를 통해 제조·모빌리티·로보틱스 등 안전성과 신뢰성이 중요한 산업에서 AI-레디 데이터 구축과 데이터 운영 효율 향상을 동시에 지원한다.

영림원소프트랩의 '시스템에버(SystemEver)'는 웹과 모바일 환경을 모두 지원하는 클라우드 기반 SaaS형 ERP로 언제 어디서나 업무 처리가 가능한 통합 업무 환경을 제공한다. 서버·네트워크·데이터를 포함한 인프라를 통합 관리해 별도의 구축 부담을 줄이고, 구축형 ERP 대비 초기 투자 비용을 낮추면서도 빠른 도입이 가능한 점이 특징이다. 특히 별도의 IT 인력이 부족한 기업도 쉽게 운영할 수 있도록 설계됐다.
시스템에버는 마이크로소프트 애저 기반 자동 스케일업 구조와 다국어·다통화 지원, 실시간 데이터 통합 관리 기능을 제공한다. 또한 맞춤형 보고서 출력, 활동기준 원가 산출, 부문별 수익성 분석 기능을 통해 경영 데이터 활용 수준을 높일 수 있도록 지원한다. 그룹웨어, 은행, 전자세금계산서, 경비지출관리 서비스와의 연동을 통해 종이 중심 업무를 디지털 기반 업무 환경으로 전환할 수 있도록 돕는다.
아이콘 기반으로 업무 흐름을 시각화하는 '프로세스 메뉴' 기능은 ERP 활용 경험이 적은 사용자도 직관적으로 업무를 이해하고 진행할 수 있도록 지원한다. 동시에 ERP 내부 데이터와 외부 시장 데이터를 통합 분석하는 AI 기반 경영분석 기능과 챗봇 기반 질의 응답 환경을 제공해 경쟁사 비교, 환율 변동 등 다양한 변수 분석을 지원하며 최고경영자의 신속한 의사결정을 지원한다. 또한 TLS 암호화 기반 네트워크 구간 보호와 개인정보법 및 정보통신망법 제29조 기준에 따른 데이터 관리 체계를 적용하고, 정보통신산업진흥원(NIPA) 품질성능 인정을 획득해 보안성·가용성·확장성 측면에서도 안정적인 ERP 운영 환경을 제공한다.

생성AI와 AI Agent 활용이 확대되면서 금융권 데이터 플랫폼은 단순 저장과 리포팅 중심 구조에서 실행 가능한 인사이트 제공 기반으로 빠르게 전환되고 있다. 이러한 환경에서 테라데이타 밴티지클라우드(VantageCloud) 기반 레이크하우스는 정형·반정형·비정형 데이터를 통합 수용하는 개방형 아키텍처를 통해 데이터웨어하우스와 데이터레이크 분리 운영 구조를 단순화하고 대용량 데이터 저장·조회·분석 효율을 높이는 기반을 제공한다. 특히 하둡 환경 현대화와 오브젝트 스토리지 결합 구조 지원이 특징이다.
금융권에서 요구되는 보안성과 거버넌스 측면에서도 밴티지클라우드는 데이터 통합, 접근 통제, 운영 관리, 감사 대응 체계를 함께 제공하는 구조로 설계됐다. 이를 통해 데이터 출처, 가공 기준, 권한 체계를 명확히 관리할 수 있어 규제 환경에서도 AI 활용 기반을 안정적으로 확장할 수 있다. 온프레미스와 프라이빗 클라우드 중심 레이크하우스 구축 흐름과 결합되면서 금융권의 신뢰 기반 데이터 플랫폼으로 활용성이 높아지고 있다.
또한 테라데이타 MCP 서버는 AI 에이전트가 승인된 데이터 구조와 의미 체계 안에서 분석하도록 지원해 자연어 기반 분석 환경의 신뢰성을 높이고 할루시네이션을 줄이는 역할을 수행한다. 엔터프라이즈 벡터 스토어(Enterprise Vector Store)는 문서·이미지·음성 등 멀티모달 데이터를 관계형 데이터와 통합 활용할 수 있도록 지원해 RAG, AI 상담, 지식 탐색, 고객 분석 등 금융권 AI 서비스 확장 기반을 제공한다.
[데이터 관리]
AI 워크로드가 기업 핵심 인프라로 확산되면서 데이터 스토리지 역시 초고속 처리량과 실시간 추론, 대규모 학습을 동시에 지원하는 구조가 요구되고 있다. 넷앱 AFX(NetApp AFX)는 이러한 환경을 위해 설계된 분산형 스토리지 플랫폼으로 온탭(ONTAP) 기반 아키텍처를 중심으로 데이터 관리 기능과 고성능 확장 구조를 통합 제공한다. 특히 정책 기반 접근 제어를 통해 AI가 필요한 데이터에만 접근하도록 설계돼 데이터 활용 효율과 보안 통제를 동시에 확보할 수 있다.
넷앱 AFX는 데이터 관리 계층과 스토리지 용량 계층을 분리한 분산 아키텍처를 적용해 성능과 용량을 독립적으로 확장할 수 있도록 설계됐다. 병렬 NFS(pNFS) 기반 파일 접근과 AWS S3 호환 오브젝트 스토리지를 동시에 지원해 다양한 애플리케이션 환경에서 활용 가능하며, 스냅미러(SnapMirror)와 플렉스캐시(FlexCache)를 통해 온프레미스와 클라우드 간 데이터 이동성과 연속성을 확보한다. 또한 무중단 확장 구조를 기반으로 엔터프라이즈 환경에서 요구되는 안정성과 가용성을 동시에 지원한다.
특히 넷앱 AI 데이터 엔진(AI Data Engine)은 실시간 메타데이터 처리와 인라인 벡터화, 시맨틱 검색 기능을 통해 데이터 탐색과 큐레이션을 자동화하며 AI 학습과 추론에 필요한 데이터 확보 속도를 높인다. NVMe 기반 NX224 인클로저와 GPU 기반 DX50 데이터 컴퓨팅 노드 구조는 데이터 처리 지연을 최소화하고 분석 효율을 높이며, 키스톤 STaaS(Keystone STaaS) 구독 모델은 초기 투자 부담 없이 사용량 기반 비용 구조를 제공해 AI 데이터 인프라 도입 유연성을 강화한다.

AI 기반 워크로드 확산으로 데이터 생성과 저장 수요가 급증하면서 데이터센터는 저장 용량 확대뿐 아니라 전력 소비, 냉각 효율, 공간 활용까지 동시에 고려해야 하는 환경에 직면하고 있다. 이러한 변화 속에서 씨게이트의 '모자익(Mozaic)' 플랫폼은 디스크, 헤드, 미디어, 컨트롤러, 펌웨어를 통합한 플랫폼 아키텍처 기반으로 설계된 차세대 스토리지 기술로, AI 시대 데이터 인프라 확장 요구에 대응하는 구조를 제시한다.
모자익 플랫폼의 핵심은 HAMR(Heat-Assisted Magnetic Recording) 기반 기록 밀도 혁신이다. 레이저를 활용해 디스크 표면을 순간 가열한 뒤 데이터를 기록하는 방식으로 기존 PMR·SMR 대비 더 작은 자기 입자에 안정적으로 데이터를 저장할 수 있어 단위 면적당 저장 용량을 크게 높인다. 이를 통해 40TB 이상의 초대용량 HDD 구현이 가능하며 향후 50TB, 100TB 이상으로 확장 가능한 로드맵을 제시해 동일 공간 대비 저장 효율을 높이고 인프라 복잡도는 줄인다.
또한 고밀도 구조는 동일 용량 기준 필요한 드라이브 수를 줄여 전력 소비와 냉각 비용 절감 효과를 제공하며 데이터센터 총소유비용(TCO) 최적화에 기여한다. 대규모 데이터 레이크와 아카이빙 환경에서 데이터 접근성과 처리 효율을 동시에 높이고 하이브리드 및 멀티클라우드 환경에서도 일관된 데이터 관리 구조를 지원해 AI 학습·추론 중심 데이터 파이프라인 운영 효율을 향상시키는 AI 인프라 최적화 기반을 제공한다.

기업 IT 환경이 클라우드, SaaS, 멀티클라우드, AI 플랫폼 중심으로 확장되면서 데이터 보호 방식도 저장 중심에서 복원력 중심으로 전환되고 있다. 빔소프트웨어는 이러한 변화에 대응해 '빔 데이터 플랫폼(Veeam Data Platform)'을 통해 클라우드, 가상, 물리, SaaS, 쿠버네티스 환경 전반의 데이터를 단일 플랫폼에서 통합 보호하는 구조를 제시했다. 이를 통해 복잡한 인프라 환경에서도 일관된 데이터 보호 정책 적용과 재해 발생 시 신속한 복구 체계를 지원한다.
이 플랫폼은 제로 트러스트 데이터 복원력(ZTDR) 개념을 적용해 랜섬웨어 대응 역량을 강화한 것이 특징이다. 마이크로소프트 애저 기반의 완전 관리형 스토리지 서비스인 '빔 데이터 클라우드 볼트'를 통해 변경 불가능한 저장 구조와 암호화 기반 논리적 에어갭 환경을 제공하며, 역할 기반 접근 제어(RBAC), 시큐어 리스토어, 슈어백업, 슈어리플리카 기능을 통해 복구 가능성 검증과 안전한 복원 절차를 지원한다.
또한 웹 UI 기반 중앙 관리와 단일 클릭 복구 기능을 통해 운영 효율성을 높이고, 백업 데이터 마운트를 활용한 분석·보안 검사·데이터 재활용을 지원한다. 쿠버네티스 환경에서는 빔 카스텐을 통해 애플리케이션 단위 보호와 정책 기반 자동화 복구를 제공하며, AI 기반 통찰력을 활용한 백업 성능 최적화와 위험 조기 탐지 기능도 지원한다. 이를 통해 기업은 대규모 멀티 환경에서도 안정적인 데이터 보호와 비즈니스 연속성 확보 기반을 구축할 수 있다.

생성AI 도입이 기업 전반으로 확산되면서 내부 데이터를 활용한 구축형 AI 활용이 확대되고 있다. 특히 조직 내 텍스트 데이터의 90% 이상이 문서 형태로 존재하는 환경에서 문서 중심 비정형 데이터 관리 역량은 AI 성능과 신뢰도를 좌우하는 핵심 요소로 부각되고 있다. 파수의 '랩소디(Wrapsody)'는 이러한 환경에서 문서 자산화와 버전 관리, ROT 데이터 관리, 파일 단위 권한 제어를 통해 AI 학습 데이터 품질과 가용성을 동시에 확보하는 문서 중심 AI 데이터 관리 플랫폼이다.
랩소디는 문서가상화(Document Virtualization) 기술을 기반으로 분산 저장 환경에서도 문서를 중앙에서 통합 관리할 수 있도록 설계됐다. 각 문서에는 고유 콘텐츠 ID가 부여되고 로컬 복사본이 기준 문서를 참조하는 구조로 운영돼 물리적으로 분산된 문서를 하나의 가상 콘텐츠로 관리한다. 또한 문서별 버전 정보와 접근 권한, 사용 이력, 태그 등 메타데이터를 함께 유지해 데이터 일관성과 추적성을 확보하며 AI 학습 환경에서 단일 진본 데이터 기반 구조를 구현한다.
이와 함께 문서 자체 권한 통제 구조를 적용해 RAG 기반 생성AI 활용 과정에서도 사용자 권한에 따른 데이터 접근 통제를 수행한다. 권한이 없는 문서는 데이터 수집 단계뿐 아니라 LLM 응답 조합 과정에서도 자동 제외된다. 또한 자동 동기화 기능을 통해 문서 변경 시 AI 데이터베이스가 실시간 갱신돼 최신 데이터 기반 학습과 응답 품질을 유지한다. 이를 통해 기업은 문서 통합 관리와 보안, AI 활용을 동시에 구현하는 데이터 거버넌스 기반을 확보할 수 있다.

AWS는 에이전틱 AI 환경에서 요구되는 데이터 활용 구조를 지원하기 위해 개방형 데이터 아키텍처 기반의 AI 데이터 파운데이션 전략을 제시했다. AWS는 아이스버그 REST 카탈로그와 연합 쿼리를 기반으로 30개 이상의 데이터 소스를 단일 인터페이스에서 통합 조회할 수 있고, 아마존 S3(Simple Storage Service) 기반 아이스버그 제로 ETL 기능을 통해 데이터 복제 없이 즉시 공유 가능하다. 이를 통해 데이터 위치와 형식에 관계없이 다양한 데이터를 연결해 활용할 수 있는 통합 데이터 접근 구조를 구현한다.
또한 AWS는 아마존 오로라, 아마존 RDS for 포스트그레SQL, 아마존 냅튠, 아마존 도큐먼트DB, 아마존 오픈서치 서비스 등 다양한 데이터베이스 전반에서 네이티브 벡터 검색 기능을 제공해 생성AI 및 에이전틱 AI 애플리케이션 개발을 지원한다. MCP 지원으로 아마존 베드록과 데이터 연계를 강화하고, 다양한 모델과 데이터 자산을 연결하는 기반을 제공해 데이터 저장·검색·모델 활용을 하나의 흐름으로 연결하는 AI 데이터 활용 환경을 지원한다.
이와 함께 AWS는 아마존 S3의 99.999999999% 내구성과 99.99% 가용성, 아마존 오로라의 최대 99.999% 가용성을 기반으로 대규모 AI 데이터 운영 환경을 안정적으로 지원한다. 아마존 세이지메이커 카탈로그는 데이터·모델·생성AI 자산을 통합 관리하는 거버넌스 기능을 제공하며 데이터 계보 추적, 자동 분류, 데이터 품질 관리 기능을 지원한다. 또한 아마존 클라우드워치와 오픈텔레멘트리 기반 모니터링을 통해 데이터 준비부터 모델 운영까지 전 과정의 가시성을 제공함으로써 AI 데이터 활용 환경 전반의 신뢰성과 운영 효율성을 높일 수 있도록 지원한다.

임민지 기자 minzi56@etnews.com