ETRI, AI 음향 인식 대회 '세계 1위' 차지

음향 이벤트 및 장면 인식 기술 경진 대회(DCASE)에서 우수한 성적을 거둔 ETRI 연구진. 사진 왼쪽부터 이태진 미디어부호화연구실장, 박수영 연구원, 정영호 책임연구원.
음향 이벤트 및 장면 인식 기술 경진 대회(DCASE)에서 우수한 성적을 거둔 ETRI 연구진. 사진 왼쪽부터 이태진 미디어부호화연구실장, 박수영 연구원, 정영호 책임연구원.

국내 연구진이 인공지능(AI)을 이용해 소리를 듣고 관련 상황인지 기술력을 겨루는 국제대회에서 1위를 차지했다.

한국전자통신연구원(ETRI·원장 김명준)은 지난 3일 세계적인 AI 기반 음향 이벤트 및 장면 인식 기술 경진 대회인 'DCASE' 음향 장면 인식 분야에 참가해 이 같은 성적을 거뒀다고 20일 밝혔다.

올해로 6회째인 이 대회는 세계 최대 전기·전자기술자협회(IEEE) AASP가 주관하고 구글, 인텔, 아마존, IBM, 삼성, LG 등 세계 유수 기업이 참가하는 대회다. 6개 세부분야에 총 138개 팀이 473개 시스템을 제출해 지난 3월부터 6월 중순까지 과제별 기술을 겨뤘다.

ETRI는 '복수 단말 대상 음향 장면 인식' 분야에 참가했다. 이 분야는 여러 종류의 단말기로 녹음한 소리를 듣고 녹음 장소를 알아맞히는 것이 목표다.

전체 28개 팀, 92개 시스템 가운데 ETRI는 시스템 순위 1위와 2위, 팀 순위는 1위에 올랐다. 팀 순위 2위는 조지아텍-중국과기대-텐센트-UEK 연합팀이다.

ETRI 개발 기술은 '딥러닝 기반 트라이던트 구조 신경망' '비균등 입력 특징 분할 기법' 설계가 핵심이다. 향후 노약자와 청각 장애인 등을 위한 '위험 회피 기술' 분야로 응용할 수 있고, 미디어 자동 태깅 기술, 장비 상태 모니터링, 로봇 분야로도 활용 가능하다.

ETRI는 이밖에 '저복잡도 기반 음향 장면 인식' '음향 발생 방향 및 이벤트 인식' 분야에서도 우수한 성적을 거뒀다.

ETRI 김흥묵 미디어연구본부장은 “딥러닝 기반 음향 인식 기술은 향후 새로운 응용 서비스 기술 개발을 통해 국내 관련 산업의 경쟁력 확보와 시장 활성화에 크게 기여할 것”이라고 말했다.

한편 이번 대회에는 ETRI 미디어부호화연구실 소속 서상원·박수영 연구원, 정영호 책임연구원이 공동 참여했다. 이들은 이 국내외 관련 특허 17건을 출원하고, 논문 11건을 발표하기도 했다.

대전=김영준기자 kyj85@etnews.com