사진 '한 장'으로 초실사 AI 아바타 만든다…ETRI, 차세대 인터페이스 기반 구현

ETRI 연구진이 실사인물 발화 영상 생성 프레임워크 기술로 생성된 영상 결과물을 검증하고 있다.
ETRI 연구진이 실사인물 발화 영상 생성 프레임워크 기술로 생성된 영상 결과물을 검증하고 있다.

인물 사진 한장만으로 사람처럼 자연스럽게 말하는 초실사 인공지능(AI) 아바타 생성 기술이 국내에서 개발됐다.

정교한 표정, 입 모양 표현으로 실제 사람과 같은 자연스러운 대화가 가능해 보다 인간 친화적인 사용자 경험을 제공할 수 있다. 향후 완전 자율주행 시대를 대비해 직관적인 차량·사람 간 상호작용을 가능케 하는 차세대 인터페이스구현 기반이 된다. 디지털 휴먼 산업 전반으로 확산도 기대된다.

한국전자통신연구원(ETRI)은 모빌리티UX연구실 연구진이 이 같은 성과를 거뒀다고 15일 밝혔다.

기술 핵심은 기존 생성형 AI와 달리 입술·턱 등 발화와 직접 연관된 부위를 선별 학습·합성하는 독자 알고리즘이다. 불필요한 정보 학습을 줄이는 한편, 입 모양, 치아, 피부 주름 등 세밀한 얼굴 표현을 더욱 정교화했다.

실사 인물 발화 영상 생성AI 프레임워크 기술 기술개요 및 개념도
실사 인물 발화 영상 생성AI 프레임워크 기술 기술개요 및 개념도

ETRI는 기술이 CVPR, AAAI 등 국제 주요 학술대회 발표 기술보다 '합성 화질'과 '입술 동기화 성능' 면에서 우수한 성능을 입증했다고 설명했다.

기술은 자율주행차 외에 △키오스크 △은행 창구 △뉴스 진행 △광고 모델 등 다양한 산업 분야에서 활용 가능하다.

윤대섭 모빌리티UX연구실장은 “모빌리티 기술이 고도화될수록 노인이나 사회적 약자들이 소외될 수 있다”며 “AI 아바타 기술이 디지털 리터러시(정보 이해·표현 능력) 향상에 기여하고, 모두가 쉽게 이용할 수 있는 스마트 모빌리티 서비스로 발전하길 기대한다”고 말했다.

연구책임자인 최대웅 선임연구원은 “AI 아바타가 실제 사람처럼 자연스럽게 대화하고 움직이는 생성형 AI 기술을 한층 고도화할 계획”이라며 “향후 주문·상담 등 일부 인력을 대체할 상호작용 구현을 목표로 하고 있다”고 소개했다.

기술은 ETRI 기술이전 사이트에 '실사 인물 발화 영상 생성 프레임워크 기술'로 등록됐다. 연구진은 다양한 산업 분야 기술이전 및 사업화도 적극 추진할 계획이다.

김영준 기자 kyj85@etnews.com