<솔루션시장 도전과 응전>음성 인터페이스-생활기기들이 똑똑해 졌어요

📁관련 통계자료 다운로드음성기술시장과 주요 IT산업의 세계시장 규모 비교

 ‘“불켜!”라고 말하면 불을 켜는 조명등, “텔레비전 켜”라고 하면 켜지는 TV, 말만 하면 창문도 올렸다 내리고 오디오도 마음대로 조정한다. 목적지만 말하면 자동으로 목적지까지 데려다 주는 자동차, 키보드나 마우스 없이 말로 원하는 프로그램을 실행시키고 말한 내용을 그대로 받아 적을 줄도 아는 컴퓨터, 전화 한 통화로 원하는 정보를 알려주고 음성으로 항해하는 인터넷’이 더 이상 꿈이 아니다. 이미 사용중이거나 가까운 미래에 사용 가능한 것들로 음성인식 기술이 만들어 가는 새로운 세상의 한 단면이다.

 공상과학 영화의 단골 메뉴인 음성인식 기술이 속속 실생활에 스며들기 시작하며 새로운 시장을 창출하고 있다. 텔레포니·가전·게임·PC를 중심으로 활용범위를 넓혀 온 음성기술은 최근 유무선 통신사업자와 자동차회사들까지 음성기술을 적극 도입함에 따라 정보기술(IT)의 핵심기술로 자리잡고 있다. 이에 따라 국내 음성업계가 조사한 바에 따르면 지난해 약 180억원 규모를 형성했던 국내 음성기술 시장은 2005년에는 1000억원의 시장을 형성할 전망이다.

 △음성기술에는 어떤 것들이 있나.

 음성 기술에는 여러 분야가 있다.

 대표적인 음성기술에는 음성인식이 있다. 음성인식 기술은 사람의 음성을 컴퓨터가 알아들을 수 있도록 하는 기술로, 음성을 컴퓨터 언어로 변환시키는 기술이라고도 할 수 있다. 음성인식을 구현하는 기술에는 여러 가지 방법이 있지만 최근에는 통계적 언어모델 기법의 하나인 HMM(Hidden Markov Model)에 의한 방법이 주류를 이루고 있다.

 음성인식은 다시 특정한 사람의 음성인식을 목적으로 하는지 아니면 불특정 대다수의 음성인식을 목적으로 하는지에 따라 ‘화자종속’과 ‘화자독립’으로 나뉜다. 또 발음형태에 따라서 ‘고립단어 인식’ ‘연결단어 인식’ ‘연속어 인식’ ‘대화체 인식’ 등으로 구분된다.

 음성기술의 또 다른 분야는 음성합성(Text To Speech)이다. 음성합성은 텍스트를 자연스러운 음성으로 만드는 기술로 음성인식의 반대 과정이다.

 이와 함께 말하는 사람의 목소리를 확인하는 화자인증 기술도 최근 주목받고 있는 기술이다.

 △음성기술의 적용분야

 음성인식 기술이 실질적으로 사용되기 시작한 것은 전화를 이용한 텔레포니 분야다. 증권정보와 무인 자동 교환 등의 서비스에 음성인식 기술이 제한적인 형태로 도입됐다. 무인 자동 교환기는 수십명에서 수천명의 직원을 두고 있는 회사나 공공기관 등에서 별도의 교환원 없이도 부서나 직원 이름을 발성하면 전화를 연결해주는 서비스로, 전화 접속량이 많은 공공기관을 중심으로 확대됐다.

 음성기술이 발전하면서 각종 고객 센터나 항공편 안내, 예약여행정보, 홈쇼핑 등 좀 더 복잡한 형태의 서비스를 필요로 하는 여러 분야에 점차로 확산돼 최근에는 전화를 통해 인터넷을 항해할 수 있도록 한다(Voice-accessible Internet)는 보이스 포털까지 등장했다.

 이밖에도 PC와 임베디드 분야에서도 많은 시도가 이뤄지고 있다. 휴대폰·PDA 등에는 이미 음성인식 기술이 적용됐거나 진행중이며 기기의 소형화에 따른 입출력 수단의 제약은 음성인식 기술의 필요성을 높여가고 있다.

 △뜨거운 국내 음성기술 시장

 국내에서 음성기술에 대한 연구는 80년대 중반 이후부터 LG종합기술원·삼성종합기술원과 같은 대기업, ETRI와 한국통신 등의 정부 출연연구소 그리고 KAIST 등의 학계를 중심으로 기술 개발이 이뤄졌다. 90년 후반부터 상용화된 제품이 출시됐고 시장의 수요가 증대하면서 99년 후반에는 벨기에 음성기술업체인 L&H코리아와 LG종합기술원 출신들의 보이스웨어가 설립됐다. 2000년에 들어서 서울대학교의 넷더스, KAIST의 보이스피아·SL2, 강원대학교의 D&M테크놀로지, 삼성의 HCI랩 등 많은 음성기술업체들이 설립됐다.

 2001년에는 세계적인 음성기술업체인 뉘앙스와 스피치웍스 국내에 지사를 설립하면서 국내 음성기술 시장의 본격적인 경쟁구도를 몰고 왔다. 또 음성기술을 받아 음성기술관련 사업을 하는 응용 애플리케이션을 개발하는 업체도 국내에 200여개가 설립돼 음성 시장을 달구고 있다.

 

◆인터뷰-이인석 음성기술산업협회 회장

 “이제는 사람과 기계가 서로 인터페이스를 하는 것이 아니라 기계가 사람처럼 사람의 대화를 이해하는 시대가 도래한 것입니다.”

 한국SIT산업협회 이인석 회장은 음성기술의 현주소를 두고 이렇게 말했다. 공상과학영화에서 영화에서 보는 음성기술이 결코 멀지 않았음을 귀띔하고 있다.

 이 회장은 “그 동안의 IT는 기구를 통해 사람의 기능 중 일부를 수행하는 것에 초점을 맞췄다면 음성기술은 기계와 사람이 직접 의사소통을 하는 것에 초점을 맞추고 있다”고 설명했다.

 아직도 우리 주위를 둘러싼 대부분의 기구들은 손으로 작동된다. 그러나 자세히 살펴보면 이것을 말로 명령하고 기계는 말을 알아듣는 기술이 우리 가까이에 스며들어 있다. 이미 전등 정도는 스위치를 건들지 않고 말로 켤 수 있으며 날씨를 알아본다든가 주가정보 등도 전화기를 통해 음성으로 정보를 이용할 수 있다.

 특히 임베디드칩을 이용한 제품이나 텔레메틱스는 빠른 속도로 음성기술을 실생활에 접목돼 많은 부분에서 우리들의 생활을 변화시키고 있다.

 이 회장은 “앞으로는 기계가 사람의 음성을 알아듣는 정도를 넘어 사람이 잘못 말한 것에 대해서도 기계가 이해하고 정확한 정보를 제공해주는 기술이 선보일 것”이라고 설명했다.

 이 같은 기술을 보기 위한 과정에서 풀어야 할 숙제도 많다.

 우선 잡음이 섞이고 원거리에서도 높은 인식률을 확보하는 것이 문제다. 현재로서는 잡음이 섞인 가운데에서는 인식률이 떨어지며 몇 미터 이상의 원거리에서도 음성인식은 약점을 드러내고 있기 때문이다. 여기에 데이터베이스 구축비용을 줄이기 위한 가변어 인식기술과 사람의 문장을 자연스럽게 인식하는 자연어 인식기술에 대한 진보도 해결과제로 남아 있다.

 그러나 이 회장은 음성기술이 다른 어떤 IT분야보다 큰 잠재력을 가지고 있음에는 의심할 여지가 없다고 장담한다.

 이 회장은 “현재의 음성기술은 영화 ‘스타트랙’에 비하며 아직은 수준 이하인 것은 사실이지만 빠른 속도로 기술개발이 이뤄지고 있으며 분야에 따라서는 현재의 기술로도 충분히 효과를 발휘할 수 있다”고 설명했다.

<윤대원기자 yun1972@etnews.co.kr> 

 

◆음성인식기술 어디에 적용하나 

음성기술의 적용분야가 다양해지고 있다. 그 동안 전화서비스를 중심으로 발전을 보이던 음성기술이 최근 PC 애플리케이션·임베디드시장·보안 등 다양한 분야로 적용이 확대되고 있으며 새로운 분야를 공략하기 위한 업체들의 발걸음이 빨라지고 있다.

 업계가 새로이 공략하는 시장은 금융·전자상거래·증권거래·IMT2000·UMS분야며 적용이 간편한 임베디드(embedded)분야도 기존의 장난감 시장에서 텔레메틱스·이동전화기·PDA·전자북으로 시장이 다양해지고 있다.

 보이스웨어는 올해 분야별로 시장이 다양해지고 있다고 판단, 음성인식 및 합성 기술을 적용한 카내비게이션·PDA·장난감·홈오토메이션 등에 시장에 대한 기술제안과 협력을 다각적으로 진행중이다. 보이스웨어는 최근 음성인식 기술이 적용된 디지털 장난감을 내놓았으며 음성기술을 접목한 PDA 개발에도 착수했다.

 보이스웨어는 또 기존 한국어와 영어 이외에 오는 11월 일본어 버전을 출시할 예정이며 중국어 개발에도 착수하는 등 다양한 언어개발에도 박차를 가하고 있다.

 음성인식분야가 주력이던 스피치웍스도 최근 화자인증 제품으로 국내 음성시장 공략을 다각화하고 있다. 스피치웍스는 지난달 미국 T-NETIX사로부터 이 화자인증 기술에 대한 지적재산권을 인수했다. 스피치웍스는 국내 파트너사를 통해 화자인증 엔진에 대한 국내 공급을 본격화한다는 계획이다.

 스피치웍스는 금융권의 주5일 근무제 도입으로 인한 폰뱅킹 서비스 이용이 급증하면서 개인정보보호 및 보안강화 분야의 시장이 새롭게 부상할 것이라는 판단이다.

 에스엘투(SL2)는 기존 CTI 분야에서 향후 부가가치가 높은 텔레메틱스 시장에 회사 역량을 집중하고 있다.

 이 회사는 이를 위해 최근 GPS 및 GIS 전문업체인 지지21과 음성합성 기술을 이용한 카내비게이션 시스템 공동개발에 착수했다. 에스엘투는 GPS 단말기에 음성합성 엔진을 탑재해 운전자의 시선 처리에 관계없이 교통정보를 전달할 수 있는 제품을 개발할 계획이다.

<윤대원기자 yun1972@etnews.co.kr>



★관련 그래프/도표 보기