카카오, "고음질 우리말 음성기술 뉴톤톡 맘껏 쓰세요"

English Translation

카카오가 사람이 말하듯 자연스럽게 소리 내는 고음질 음성합성 엔진을 모든 개발자에게 추가 공개했다.

지난해 6월 처음 선보인 ‘뉴톤 톡’ 음성합성 기술보다 개선된 형태다. 구글과 달리 안드로이드는 물론이고 애플 iOS까지 지원한다.

김훈 카카오 음성처리파트장(왼쪽)과 김봉완 음성처리파트 부장이 제주 카카오 본사에서 새롭게 개발해 공개한 뉴톤 톡 합성엔진을 소개했다.
김훈 카카오 음성처리파트장(왼쪽)과 김봉완 음성처리파트 부장이 제주 카카오 본사에서 새롭게 개발해 공개한 뉴톤 톡 합성엔진을 소개했다.

김훈 카카오 음성처리파트장은 “뉴톤 톡 고음질 버전 공개로 국내에서 스마트폰에 음성기술을 활용한 앱 개발이 본격화하길 기대한다”고 밝혔다.

김 파트장은 “이번에 개발한 음성합성 기술은 기존에 개발한 대화형과 낭독형 엔진을 보다 자연스럽게 구현한 것”이라며 “종전 기계합성과 달리 편집합성 기술을 추가해 자연스러운 읽기가 가능하다”고 말했다.

새로운 뉴톤 톡은 사람이 글을 읽어주듯 자연스럽다. 기존 데이터보다 수배 이상 많은 문장을 녹음한 데이터와 딥러닝을 활용했기 때문이다. 어떠한 문장 조합도 자연스럽다. 음질 향상을 위해 합성 방법을 기존과 달리해 여러 방식으로 바꿔 딱딱한 기계음이 만들어질 가능성을 최소화했다.

카카오는 앞으로 뉴톤 톡을 활용한 기술 개발이 본격화될 것으로 전망했다.

스마트폰 등장과 함께 실내조명과 가전기기, 자동차 등 음성으로 연결하는 역할이 많아지기 때문이다.

김봉완 카카오 음성처리파트 부장은 “IoT 시대에 스마트기기 명령체계로 음성이 부각될 가능성이 크다”며 “뉴톤 톡이 지속적으로 널리 쓰이면 모바일과 IoT 영역 전반에서 음성기술이 발전할 것”이라고 말했다.

화면이 작은 곳에는 음성인식과 합성이 중요한 역할을 할 것이라고 덧붙였다.

김 부장은 “최근 애플워치, 갤럭시 기어2 등 출시와 IoT 관심이 높아지면서 음성인식 중요성 또한 높아지고 있다”며 “우리 말로 마음껏 기기를 조작하고 움직이는 세상을 만드는 데 카카오가 앞장서겠다”고 강조했다.

제주=

이경민기자 kmlee@etnews.com