DGIST, 자율주행 인지성능 높이는 3D 준지도 학습 프레임워크 개발

디지스트(DGIST·총장 이건우)는 권순·이진희 미래모빌리티연구부 연구팀이 라벨이 극히 적은 환경에서도 최신 성능(SOTA)을 구현한 3D 준지도 학습(SSOD) 프레임워크 '멀티플티처스(MultipleTeachers)'를 개발했다고 17일 밝혔다.

이번 연구성과는 오는 10월 19일부터 23일까지 하와이 컨벤션센터에서 열리는 세계 최고 비전 학회 'ICCV 2025'에서 공식 발표될 예정이다.

왼쪽부터 권순 연구원과 이진희 연구원.
왼쪽부터 권순 연구원과 이진희 연구원.

연구팀이 개발한 이 기술은 유사한 객체를 그룹화해 범주별 교사 네트워크를 구성하고, 협력적으로 의사 라벨을 생성하는 새로운 학습 전략을 도입했다. 여기에 희소한 라이다(LiDAR) 포인트 문제를 보완하는 'PointGen' 모듈을 결합, 차량·보행자·이륜차 등 도심 주요 객체의 인지 정확도를 크게 높였다. 적은 데이터로도 높은 학습 효과를 이끌어내 안전 중심의 자율주행 인지 기술 발전에 기여할 수 있는 새로운 패러다임을 제시했다.

자율주행 기술 고도화에는 방대한 라벨링 작업으로 인한 시간·비용 부담이 큰 걸림돌로 작용해왔다. 연구팀은 소량의 라벨 데이터와 대량의 무라벨 데이터를 결합하는 준지도·자기지도 학습을 고도화해 라벨 의존도를 낮추면서도 실험 환경에서 우수한 성능을 입증했다.

DGIST가 개발한 비전 기술은 19일 하와이에서 열리는 'ICCV 2025'에서 발표된다.
DGIST가 개발한 비전 기술은 19일 하와이에서 열리는 'ICCV 2025'에서 발표된다.

연구팀은 또 DGIST 창업기업 퓨처드라이브와 협력해 한국 도심 환경을 충실히 반영한 자체 라이다 데이터셋 'LiO'를 구축했다. LiO는 128채널 라이다 1대와 6대의 카메라로 수집한 데이터를 기반으로 7개 클래스에 대해 최소 3회 이상의 전문가 검수를 거쳐 높은 품질을 확보했다. 평균 35.8개의 객체, 약 2.1만 개의 라벨 프레임과 9.6만 개의 언라벨 프레임으로 구성돼 다양한 실험 환경에 활용 가능하다.

성능 검증에서도 탁월한 결과를 보였다. 'Waymo Open Dataset(라벨 1%)'에서 47.5 mAP, 'KITTI(라벨 2%)'에서 72.2 mAP, 'LiO Large(라벨 15%)'에서 61.4 mAP를 기록해 기존 최신 기법을 일관되게 뛰어넘었다. 특히 보행자와 이륜차 같은 작은 객체의 검출 성능이 크게 향상돼 도심 안전 강화에 기여할 것으로 기대된다.

이진희 박사는 “세계 최고 비전 학회인 ICCV 2025에서 DGIST의 인지 기술을 발표할 수 있어 영광”이라며 “LiO 데이터셋을 공개해 연구 커뮤니티와 지식을 공유하고, 자율주행·스마트시티·물류 로보틱스 등 다양한 분야로 기술 적용을 확대하겠다”고 말했다.

한편, 이번 연구는 DGIST 기관고유사업과 과학기술정보통신부 연구개발특구육성(R&D) 사업의 지원을 받아 수행됐다.

대구=정재훈 기자 jhoon@etnews.com