KAIST, 제한된 메모리로도 '휴머노이드' 눈 밝혀...세계 최고 학회서 기술력 입증

업샘플 애니띵과 기존 방식과의 성능 차이를 나타낸 비교 모식도 (AI 생성이미지)
업샘플 애니띵과 기존 방식과의 성능 차이를 나타낸 비교 모식도 (AI 생성이미지)

한국과학기술원(KAIST·총장 이광형)이 국제 공동연구진과 함께 적은 메모리만으로도 인공지능(AI)이 세상을 더욱 선명하게 볼 수 있도록 하는 기술을 개발했다. 그래픽처리장치(GPU) 메모리 효율을 최대 16배 높여, 휴머노이드 로봇과 온디바이스 AI 시대를 앞당길 핵심 기술을 구현했다.

KAIST는 김창익 전기 및 전자공학부 교수팀이 미국 메사추세츠공대(MIT)·마이크로소프트 연구진과 제한된 GPU 메모리만으로도 AI 시각 성능을 높일 수 있는 범용 기술 '업샘플 애니띵(Upsample Anything)'을 개발했다고 17일 밝혔다.

최근 휴머노이드 로봇과 자율주행 시스템, 세계모델(현실 세계 물리 환경 및 변화를 학습·예측하는 AI 모델) 기반 AI는 연산 속도를 높이고 메모리 사용량을 줄이기 위해 입력 영상을 저해상도 특징 정보로 압축해 활용한다.

이에 압축 과정에서 중요 시각 정보가 손실되는 문제가 발생한다. 반대로 모든 영상을 고해상도 처리하면 막대한 GPU 메모리와 연산 자원이 필요해 실시간 처리가 어렵다. 이는 스마트폰과 같은 소형 기기나 기동성이 중요한 로봇이 주변 환경을 정밀 인식하는데 장애가 된다.

연구개요도
연구개요도

이에 연구팀은 입력 이미지 경계와 구조 정보를 활용해 저해상도 특징 정보를 고해상도로 복원하는, 트레이닝 프리 업샘플링 기술, 업샘플 애니띵을 개발했다.

연구팀은 AI 연구에서 널리 활용되는 224×224 크기 이미지(약 5만 픽셀) 기준 약 0.4초 계산만으로 원본에 가까운 시각 정보를 복원했으며, GPU 메모리 효율을 최대 16배까지 향상시켰다. 제한된 연산 자원만으로도 AI가 주변 환경을 더욱 정밀하게 인식할 수 있게 했다.

김창익 교수는 “이번 기술은 적은 자원으로도 AI 시각 정밀도를 크게 높일 수 있는 알고리즘으로, 휴머노이드 로봇과 온디바이스 AI의 실용화를 앞당길 것으로 기대한다”고 말했다.

이번 연구는 서민석 KAIST 박사과정 학생이 제1 저자로 참여했으며, 성과는 AI 및 컴퓨터 비전 분야 세계 최고 권위 학회인 'CVPR 2026'에서 6월 7일 발표됐다. 또 해당 학회서 전체 1위인 'CVPR 컴퓨트 골드 스타'를 수상하고, 연구 과정 투명성과 재현 가능성 부문 '트랜스패런시 챔피언'에 선정됐다.

김영준 기자 kyj85@etnews.com