이교구 서울대 교수, 한국소프트웨어산업협회 포럼서 AI 음성 기술 혁신 제시

[사진=한국소프트웨어산업협회(KOSA) 제공]
[사진=한국소프트웨어산업협회(KOSA) 제공]

한국소프트웨어산업협회(KOSA)가 서울 삼정호텔에서 국내 주요 소프트웨어 기업 대표와 임원진 등 100여명이 참석한 가운데 '제29회 KOSA 런앤그로우 포럼'을 성공적으로 마쳤다.

이교구 서울대학교 교수가 '콘텐츠를 위한 생성형 인공지능(AI) : 영향과 응용 사례'를 주제로 강연했다.

이 교수는 AI 오디오 전문기업 수퍼톤의 공동 창업자이자 대표다. 지난해 9월 미국 시사주간지 타임(TIME)이 선정한 '2024 AI 분야 가장 영향력 있는 100인(타임 100 AI)'에 한국인으로는 유일하게 선정된 바 있다. 글로벌 AI 음성 합성 분야에서 영향력을 인정받았다.

그는 AI 음성 합성 기술이 음악, 영화, 애니메이션, 게임 등 콘텐츠 산업 전반에 미치는 혁신적 변화를 여러모로 조명했다. 특히 기획, 제작, 후반 작업, 배급에 이르는 콘텐츠 제작 전 과정에서 AI 음성 기술이 가져올 발전 가능성을 심도 있게 다뤘다.

강연 핵심인 낸시(NANSY) 파운데이션 모델은 사람의 음성을 네 가지 요소로 분해하고 재구성한다. △음색(Timbre, 누가 말하는가) △발음(Linguistic, 어떻게 말하는가) △음고(Pitch) △강세(Loudness)를 개별적으로 제어할 수 있다. 예를 들어 영화 더빙 시 배우의 고유한 음색은 유지하면서 다양한 언어로 자연스러운 연기가 가능하다. 이 교수는 실제 더빙 사례를 시연했다.

이어 '보이스 디자인(Voice Design)' 기술을 소개했다. 이는 나이와 성별에 따른 음성 특성을 자유롭게 제어할 수 있다.

이 교수는 이 기술로 이론적으로 무한한 수의 독창적인 목소리를 생성할 수 있다는 점을 실제 사례와 함께 설명했다.

KOSA는 제30회 런앤그로우 포럼을 오는 3월 26일 개최할 예정이다.

류태웅 기자 bigheroryu@etnews.com