[에듀플러스]한양대 조기춘 교수팀, 최고 AI 학회 'CVPR 2026' 자율주행 대회서 1위 및 효율성 혁신상 2관왕 석권

발행일 : 2026-06-16 15:26

한양대학교는 조기춘 미래자동차공학과 교수 연구팀이 세계 최고 권위의 AI·컴퓨터 비전 학회 'CVPR 2026' 자율주행 워크숍(WAD)에서 열린 글로벌 데이터 분석 대회에서 시공간(Spatio-Temporal) 부문 1위와 효율성 혁신상을 동시에 수상하며 2관왕을 달성했다고 16일 밝혔다.

올해 1월 말부터 5월 말까지 약 4개월간 진행된 이번 대회는 전 세계 64개 석학 및 기업 연구팀이 참가해 1000건이 넘는 결과물을 제출했다. 한양대 연구팀은 글로벌 모빌리티 기업 우버(Uber)가 후원한 상금 총 5000달러(부문당 2500달러)를 수상했다.

자율주행차 한 대가 카메라와 라이다(LiDAR) 센서를 통해 생성하는 주행 데이터는 시간당 약 4테라바이트(TB)에 달한다. 대부분은 평범한 주행 장면이며, 안전 검증에 필요한 위험·희소 시나리오는 극히 일부다. 이번 대회는 이 방대한 데이터에서 원하는 장면을 골라내는 '시나리오 마이닝(Scenario Mining)' 기술을 겨루는 대회로, 대회 기반 벤치마크 'RefAV'는 카네기멜런대학교(CMU) 연구진이 구축했다.

과제의 핵심은 자연어 질의를 코드로 번역하는 것이다. 예컨대 '중앙선을 침범해 진로를 가로막는 대형 차량'이라고 입력하면 시스템이 실제 주행 데이터에서 해당 사건의 발생 시점과 3차원 공간상 위치를 특정한다.

기존 방식은 거대언어모델(LLM) 하나에 모든 조건을 처리하도록 해 오류가 잦고, 날씨·긴급차량처럼 영상을 직접 봐야 파악 가능한 시각 정보를 다루지 못하는 한계가 있었다.

연구팀은 이를 극복하기 위해 자체 개발한 'OASIS'(Ontology-guided Agentic Scenario-mIning System)를 제안했다. OASIS는 자연어 명령을 맥락·도로 행위자·행동·관계 네 가지 축으로 분해한 뒤, 각 조건을 여러 전문 AI 에이전트와 비전-언어 모델(VLM)에 나누어 처리하는 온톨로지 기반 멀티 에이전트 구조를 채택했다. 시각 정보는 사전 구축한 장면 데이터베이스(Scene Database)와 실시간 영상 인식 기술을 결합해 처리했다.

그 결과 핵심 평가지표 HOTA-Temporal에서 38.50점을 기록, 공식 베이스라인 대비 12.2점 차이로 세계 1위에 올랐다.

조기춘 교수는 “방대한 주행 데이터에서 원하는 장면을 정확히 찾아내는 일은 미래 자율주행의 안전성과 신뢰성을 좌우하는 핵심 과제”라며, “하나의 모델에 모든 판단을 맡기던 기존 방식의 뚜렷한 한계를 넘어, 온톨로지 기반으로 의미를 구조화하고 전문 에이전트들이 협력하도록 설계한 것이 이번 세계대회 우승의 핵심 요인”이라고 밝혔다.

이번 연구는 박정우 석박통합과정생, 나유승 박사과정생, 정성재·이민원 석사과정 연구원이 참여했다.

권미현 기자 mhkwon@etnews.com

에듀플러스