
SK텔레콤이 국내 '컴퓨트 익스프레스 링크(CXL)' 전문 기업 파네시아와 손잡고 차세대 AI 데이터센터(DC) 구조 혁신에 나선다. GPU 증설 위주였던 기존 AI 인프라 방식을 벗어나, 컴퓨팅 자원 연결 구조 자체를 바꿔 성능과 비용 효율을 동시에 높인다는 구상이다.
SK텔레콤은 4일(현지시간) 스페인 바르셀로나에서 열리고 있는 MWC26에서 파네시아와 'CXL 기반 차세대 AI DC 구조(아키텍처)' 공동 개발을 위한 업무협약(MOU)을 체결했다.
CXL은 CPU·GPU·메모리 간 데이터를 고속·저지연으로 처리할 수 있도록 자원을 유기적으로 연결하는 차세대 인터커넥트(Interconnect) 표준이다. 기존처럼 서버 단위로 자원이 고정되지 않고, 필요에 따라 유연하게 확장·조합할 수 있다.
현재 AI DC는 서버 내부에 CPU·GPU·메모리가 묶여 있는 구조이기 때문에 일부 서버에서 자원이 남아도 다른 서버에서 사용할 수 없고, 메모리 부족 시 GPU까지 함께 늘려야 하는 비효율이 나타나고 있다. AI 모델 규모가 커지며 메모리 수요가 급증하는 상황에서는 이러한 구조적 한계가 더 짙어지고 있다.
양사는 이러한 문제를 해결하기 위해 CXL 기반 기술로 연결 범위를 서버 단위에서 랙(Rack) 단위까지 넓히는 방식을 추진한다. 서버 여러 대에 걸쳐 메모리를 묶어 하나의 자원 풀처럼 구성하고, 필요한 GPU와 CPU를 선택적으로 연결해 활용하는 구조다. 이를 통해 불필요한 장비 증설 없이 GPU 활용률을 높이고 전체 시스템 비용을 절감할 수 있다.
AI 연산 과정에서 발생하는 GPU 간 협업 연산 구조도 개선한다. 지금까지는 이더넷 기반 범용 네트워크를 경유하면서 데이터 복사·소프트웨어 개입 등이 발생해 지연이 컸다. 양사는 이를 CXL 기반 고속 연결 방식으로 대체해 병목을 줄이고 학습·추론 효율을 높인다는 계획이다.
이번 협력에서 SK텔레콤은 AI DC 구축·운영 경험과 AI 모델 상용화 역량을 기반으로 실제 상용 환경에 최적화된 아키텍처 설계를 맡는다. 파네시아는 패브릭 링크 스위치와 링크 컨트롤러 등 다양한 링크 반도체 기술을 활용해 기존 서버 내부에 국한됐던 연결 구조를 랙 단위 이상으로 확장하는 역할을 담당한다.
양사는 실 환경에서 AI 모델을 구동하며 GPU·메모리 활용률, 지연시간, 처리량 등을 검증한 뒤 올해 말까지 차세대 AI DC 구조를 공개할 계획이다. 이후 대형 AI DC를 대상으로 실증을 진행해 상용화에 나선다.
정석근 SK텔레콤 AI CIC장은 “이번 협력은 연산 성능이 높아져도 데이터 이동·공급이 이를 따라가지 못하는 구조적 병목인 '메모리 월'을 완화해 AI DC 성능과 경제성을 함께 끌어올릴 것”이라고 말했다.
정명수 파네시아 대표는 “SK텔레콤과 함께 글로벌 시장이 주목할 고효율 AI DC의 표준 모델을 제시하겠다”고 밝혔다.
남궁경 기자 nkk@etnews.com