
레드햇이 AI 실험 단계와 프로덕션 수준 운영 간의 간극을 해소하는 '레드햇 AI 3.4' 대규모 업데이트를 발표했다.
레드햇은 12일(현지시간) '레드햇 서밋 2026'에서 '레드햇 AI 3.4'를 포함한 AI 포트폴리오 주요 업데이트를 발표했다.
레드햇 AI 3.4는 이달 중 공식 출시한다. 통합된 '메탈-투-에이전트' 플랫폼을 통해 하이브리드 클라우드 전반에서 에이전틱 워크플로우의 개발 및 배포를 간소화하는 것이 이번 업데이트의 핵심이다.
레드햇 AI 3.4는 개발자와 운영자를 위한 일관된 프레임워크를 제공해 엔터프라이즈 환경의 제어 기능과 하드웨어 효율성을 유지한 채 자율 시스템을 확장할 수 있도록 돕는다. 중심에는 서비스형 모델(MaaS)이 자리하고 있다. 개발자는 단일 거버넌스 인터페이스를 통해 선별된 모델에 접근하고, 관리자는 사용량 모니터링 및 정책 적용이 가능해졌다. 이는 vLLM과 llm-d를 기반으로 한 고성능 분산 추론 위에 구축되어 다양한 환경에서 최적화된 모델 서빙을 유지한다.
또한, AI 에이전트의 기하급수적인 추론 수요 증가에 발맞춰 에이전트옵스 도구가 새롭게 도입됐다. 에이전트 프레임워크와 관계없이 대규모 배포 및 관리가 가능하며, 개발부터 운영까지 통합 추적, 가시성, 암호학적 신원 관리 및 라이프사이클 관리를 지원한다.
레드햇 AI 3.4는 자율성을 가진 에이전트의 행동, 추론 단계, 도구 호출을 추적할 수 있는 인프라를 제공해 의사결정 과정의 블랙박스를 해소한다. 특히 암호화 신원 관리(SPIFFE/SPIRE)를 통합해 모든 에이전트의 행동을 검증된 신원과 연결함으로써, AI가 책임 있는 엔터프라이즈 인프라로 운영될 수 있도록 지원한다.
엔터프라이즈 데이터와 AI의 결합을 위해 MLflow 플랫폼을 기반으로 한 '프롬프트 관리' 기능과 '평가 허브'도 신설됐다. 프롬프트를 핵심 데이터 자산으로 중앙 관리하며, 생성형 및 예측형 AI 전반에 걸쳐 모델과 에이전트의 품질, 정확성, 안전성을 벤치마킹할 수 있다. 보안 측면에서는 채터박스 랩스 기술과 가락 프로젝트를 활용해 탈옥, 프롬프트 주입, 편향성 등의 위험을 검사하는 자동화된 적대적 스캐닝이 개발 주기에 통합되었으며, 엔비디아 네모 가드레일과 연동해 런타임 안전성을 확보했다.
하드웨어 유연성 및 고급 추론 기능도 대폭 최적화했다. 엔비디아 블랙웰 GPU와 AMD MI325X 아키텍처에 대한 출시 당일 지원을 포함하며, 코어위브, 애저, IBM 클라우드 등 다양한 쿠버네티스 및 서드파티 매니지드 클라우드 환경에서도 네이티브로 실행된다. 응답 속도를 2~3배 높여 비용을 절감하는 '추측 디코딩' 기능도 정식 출시했으며 복잡한 AI 작업을 자동화하는 오토RAG와 오토ML 기능도 제공된다.
조 페르난데스 레드햇 AI 비즈니스 부사장 겸 총괄 관리자는 “에이전틱 시대는 레드햇 플랫폼이 지능형 자율 시스템 운영으로 진화하는 전환점”이라며 “기업이 엄격한 통제력을 유지하면서도 대규모 혁신을 추진할 운영적 안정성을 제공할 것”이라고 밝혔다.
최호 기자 snoop@etnews.com