
“피지컬 인공지능(AI)의 성패는 '데이터'에 달려있습니다. 실증 중심 학습 인프라를 통해 국내 피지컬AI 상용화를 가속화하겠습니다.”
마음AI는 3일 경기도 성남 본사에 산업 현장에서 생성되는 데이터를 로봇 학습용 데이터로 자산화하는 '피지컬AI 데이터팩토리'를 개소하고 가동에 들어갔다.
피지컬AI 데이터팩토리는 로봇·자율주행 등 피지컬AI 상용화를 앞당기기 위한 데이터 수집·학습 인프라다. 가상 시뮬레이션, 로봇 실증, 상용화로 이어지는 순환형 학습 구조를 기반으로 한다.
손병희 마음AI 연구소장은 “로봇을 현장에 투입해 발생하는 돌발 상황(Edge Case)을 실제 현실에서 학습하려면 막대한 시간과 비용이 소요된다”면서 “특히 시각과 언어를 행동으로 연결하는 비전언어행동(VLA) 모델을 구현하려면 방대한 고품질 행동 데이터가 필수지만 실제 환경에서 이를 확보하는 것은 쉽지 않다”고 설명했다.
이같은 문제를 해결하기 위해 데이터팩토리는 가상 시뮬레이션과 실제 환경을 연결하는(Sim-to-Real) 고품질 데이터 수집 기반과 VLA 모델 학습 인프라를 통해 연간 300테라바이트(TB) 이상의 학습 데이터를 생산, 축적할 수 있는 환경을 갖췄다.

디지털트윈 기반 가상공간에서 반복 실험을 통해 데이터를 대량 생성하고 테스트베드에서 실증한 뒤, 실제 산업 현장에서 산업용 로봇이 생성하는 엣지 데이터를 재수집·분석해 다시 학습에 반영하는 구조다.
우선 디지털트윈 환경에서 로봇의 숙련도 향상을 위한 기초 데이터를 수집한다. 회사는 학습용 서버로 엔비디아 DGX H100 12대, DGX A100 4대, SSD 스토리지 서버 4대 등 고성능 컴퓨팅(HPC) 자원을 구축했다.
실증 공간에서는 휴머노이드와 이동형 로봇이 실제 환경에서 구동되는 과정을 시뮬레이션하고 알고리즘의 안정성을 검증한다. 애지봇, 레인보우로보틱스, 뉴로메카의 휴머노이드 로봇 4대를 비롯해 양팔 로봇, 사족보행 로봇, 배달 운반 차량 등 다양한 로봇 라인업을 확보해 행동 데이터를 수집한다.
수집된 영상, 센서, 관절 제어 데이터는 분석 서버에서 정제된 후 강화학습에 활용된다. 개선된 모델은 마음AI의 엣지디바이스 '메이드(MAIED)'를 통해 현장 로봇에 업데이트된다.
손 소장은 “단순한 하드웨어 구동을 넘어 로봇 스스로 환경 변화에 적응하며 진화하는 학습 루프를 구축한 것이 핵심 전략”이라고 설명했다.
마음AI는 이번 1호점 개소를 시작으로 향후 지자체, 산업계와 연계한 2,3호점 구축을 추진한다. 농기계·건설·방산 등 수요 기업과 AI 반도체 및 로봇 소프트웨어 기업, 대학·연구기관 등과 협력해 생태계를 확장한다는 전략이다.
유태준 마음AI 대표는 “AI 경쟁력의 핵심은 현장 데이터를 지속적으로 학습에 투입할 수 있는 구조적 효율성에 있다”며 “이번 1호 센터를 시작으로 산업군별 특화된 데이터팩토리를 순차적으로 확장해 나갈 것”이라고 강조했다.
정현정 기자 iam@etnews.com