에스유엠, 피지컬 AI 데이터 운영 플랫폼 'Abyss' 개발

현실 데이터 AI로 연결하는 데이터 플라이휠 구축

에스유엠. 사진=에스유엠
에스유엠. 사진=에스유엠

자율주행 기술 기업 에스유엠(SUM)이 AI 학습을 위한 데이터 운영 플랫폼 'Abyss'를 공식 공개했다.

최근 자율주행을 비롯한 Physical AI 산업에서는 AI 모델 성능보다 데이터 운영 효율성이 경쟁력을 좌우하는 요소로 주목받고 있다. 현실 데이터를 얼마나 빠르게 확보하고, 품질을 관리하며, 학습 데이터로 전환하는지가 AI 고도화의 핵심으로 자리 잡고 있다.

Abyss는 데이터 수집부터 자동 라벨링, 데이터셋 생성, 배포까지 전 과정을 자동화해 현실세계 데이터를 AI 학습으로 연결하는 통합 플랫폼으로, 차량에서 생성되는 멀티카메라 영상과 센서 데이터를 자동 수집한 뒤 데이터 무결성 검증, 시간 동기화, 품질 평가, 자동 라벨링, 데이터셋 구축 및 배포를 하나의 시스템에서 수행한다. 분산돼 있던 데이터 관리 과정을 통합해 운영 효율성을 높인 것이 특징이다.

플랫폼은 데이터의 생성부터 활용, 보존, 폐기까지 전 과정을 추적 가능한 라이프사이클로 관리하며, 품질 기준을 통과하지 못한 데이터는 학습 과정에서 자동 제외한다. 또한 모든 데이터셋을 변경이 불가능한 버전으로 관리해 AI 모델 학습 이력을 완전하게 재현할 수 있도록 설계됐다.

자동 라벨링 기술 역시 Abyss의 핵심 경쟁력이다. SUM은 자체 자율주행 인지 기술과 Vision Language Model(VLM)을 결합해 차량이 인식한 객체와 주행 상황을 자동 분석하고 라벨링하는 기술을 구현했다. 이를 통해 외부 라벨링 작업 의존도를 줄이고 대규모 데이터 구축 시간을 크게 단축했다.

이와 함께 개인정보 보호 기능도 포함됐다. 수집되는 영상은 보행자 얼굴과 차량 번호판 등을 자동 비식별화한 뒤 저장 및 배포돼 기업과 연구기관이 규제 부담을 줄이면서 데이터를 활용할 수 있도록 지원한다.

또한 VLM 기반 데이터 분석 기능은 도로 유형, 기상 조건, 시간대, 주행 상황 등을 자동으로 분류하고 데이터 편향과 부족한 시나리오를 분석한다. 이를 바탕으로 추가 확보가 필요한 데이터를 제안해 AI 학습과 데이터 확보가 지속적으로 반복되는 운영 체계를 제공한다.

에스유엠. 사진=에스유엠
에스유엠. 사진=에스유엠

SUM 관계자는 “Abyss는 단순한 데이터 관리 플랫폼이 아니라 AI를 지속적으로 성장시키는 데이터 운영 플랫폼이다”며 “자율주행에서 축적한 기술을 기반으로 스마트물류, 스마트항만, 스마트팩토리, 로보틱스 등 다양한 Physical AI 분야로 적용 범위를 확대할 계획이다”고 밝혔다.

한편 Abyss는 정부의 자율주행 데이터 구축 표준이 제시하는 데이터 전주기를 반영해 개발됐으며, SUM은 앞으로 자체 운영 데이터를 활용해 플랫폼 성능을 지속적으로 고도화할 예정이다.

이원지 기자 news21g@etnews.com