글로벌 인공지능(AI) 경쟁 축이 현실 세계를 움직이는 피지컬AI와 월드모델로 이동하는 가운데, 세계적 AI 석학 얀 르쿤 교수가 AI가 현실의 물리 법칙을 오차 없이 학습할 수 있다는 것을 수학적으로 입증했다.
3일 업계에 따르면 얀 르쿤 뉴욕대 교수 연구팀은 최근 논문 사전 공개 사이트 아카이브(arXiv)에 '공동 임베딩 예측 아키텍처(JEPA)' 구조를 수학적으로 증명한 논문(When Does LeJEPA Learn a World Model?)을 공개했다.
거대언어모델(LLM)은 문맥상 다음에 올 단어를 확률적으로 예측하는 구조적 특성 때문에 존재하지 않는 사실을 지어내는 환각 현상(할루시네이션)을 원천 배제할 수 없다. 오차가 치명적인 사고로 이어지는 자율주행이나 정밀 제조 로봇 공정에 LLM을 전면 도입하기 어려운 이유로 지적된다.
월드모델은 AI가 외부 세계의 상태를 인식하고 특정 행동을 수행했을 때 세계가 어떻게 변할지 예측하는 모델이다. 르쿤 교수가 기존 생성형 모델의 한계를 극복할 대안으로 제시한 JEPA는 픽셀 단위의 예측 대신 의미 공간의 핵심 인과 관계만 추출해 학습함으로써 오류와 환각을 방지하는 아키텍쳐다.

이번 논문은 JEPA 기반 모델 'LeJEPA'가 정제되지 않은 비디오 픽셀, 센서값 등 비선형 데이터로부터 중력, 마찰력, 이동 궤적과 같은 현실 세계의 숨겨진 물리적 변수를 왜곡 없이 선형 복원해 낼 수 있음을 수학적으로 입증했다는데 의미가 있다. 인간의 증명 오류를 검증하는 머신 체크형 도구 'Lean 4'를 통해 기계 검증을 진행해 신뢰성을 확보했다.
르쿤 교수팀은 논문에서 “이 이론은 그동안 경험적으로만 성공적이었던 방법을 수학적 보장으로 전환해 현실 세계의 구조를 증명 가능한 방식으로 복원하는 월드모델 구축의 토대를 제공한다”고 설명했다.
이번 논문은 르쿤 교수가 메타를 떠나 AMI랩스를 창업한 이후 나온 중요한 연구 결과물로 평가받는다. AMI랩스는 현실 세계의 추상적 표현을 학습하는 월드모델 구축에 집중하고 있다. 엔비디아 삼성, 베조스 익스페디션 등으로부터 10억3000만 달러(약 1조5000억원)의 시드 투자를 유치해 주목받았다.
물리 세계를 정밀하게 반영하는 피지컬AI와 월드모델에 대한 관심은 커지고 있다. 지난 2월 페이페이 리 스탠퍼드대 교수가 창업한 월드랩스는 오토데스크, 엔비디아, AMD 등 주요 기업들로부터 10억달러 규모 신규 투자를 유치했다. 엔비디아는 컴퓨텍스에서 오픈형 피지컬 AI 파운데이션 모델인 '코스모스 3'를 전격 공개하고 생태계 확대를 위해 '엔비디아 코스모스 연합'을 출범했다.
정현정 기자 iam@etnews.com