
인공지능(AI) 번역 전문기업 딥엘(DeepL)은 실시간 음성 대 음성 번역 제품군 '딥엘 보이스 투 보이스(Voice-to-Voice)' 출시한다고 16일 발표했다.
딥엘은 전날 연례 고객 행사인 '딥엘 커넥트(DeepL Connect)'를 서울에서 첫 개최하고 솔루션 출시를 글로벌 최초로 알렸다.
'딥엘 보이스 투 보이스'는 딥엘의 음성 번역 솔루션 '딥엘 보이스'에 업데이트 형태로 순차 제공된다. 기존 딥엘 보이스는 화상회의나 대화시 음성을 실시간 자막으로 번역해 보여주는 방식이었다. 보이스 투 보이스는 음성 간 번역으로 동시통역과 유사한 기능을 제공한다.
'보이스 포 미팅'은 마이크로소프트 팀즈, 줌 등 플랫폼에서 실시간 번역을 제공해 각 참가자가 자신의 언어로 말하고 들을 수 있도록 지원한다. 여러 언어가 사용되는 회의에서도 모든 참가자가 각자의 모국어로 대화할 수 있도록 한다.
예를 들어, 줌 회의 중 “법무팀 확인 결과 어떻게 되나요?”라는 일본어 질문을 한국어 음성으로 번역해주고 이에 대해 “법무팀도 계획 자체엔 동의했지만 법무 관련한 내용이 몇 가지 있어서 이를 처리하는 중입니다”라고 한국어로 답변하면 이를 일본어 음성으로 통역해주는 식이다. 6월 중 얼리 액세스 프로그램을 진행할 예정이다.
이날 정식 출시된 '보이스 포 컨버세이션'은 모바일 앱과 웹을 통해 현장 대화 상황에서 실시간 음성 번역 기능을 제공하는 서비스다. '그룹 컨버세이션'은 여러 연사자와 동시 상호작용하는 교육·코칭·워크숍 환경에서 다국어 소통을 지원하며 오는 30일 정식 출시 예정이다.
'보이스 투 보이스 API'는 기업이 딥엘의 음성 번역 기능을 자체 애플리케이션과 콜센터 등 고객 응대 시스템에 직접 적용할 수 있도록 지원한다. 현재 얼리 액세스 프로그램 등록을 진행 중이다.
이번 솔루션 출시와 함께 딥엘 보이스는 기존 35개 언어에서 베트남어, 태국어, 아랍어, 노르웨이어, 히브리어, 벵골어, 타갈로그어를 추가해 전체 지원 언어 수가 40개 이상으로 확장됐다.
곤살로 가이올라스 딥엘 최고제품책임자(CPO)는 “음성 번역 지연 시간을 줄이기 위해 노력하고 있다”면서 “올해 안에 음성 복제 기능을 출시해 합성 음성이 아닌 실제 이용자의 목소리를 통한 번역 기능을 제공할 것”이라고 밝혔다.
야렉 쿠틸로브스키 딥엘 창업자 겸 최고경영자(CEO)는 “이번 업데이트는 번역 기술의 또 다른 전환점인 실시간 음성 커뮤니케이션으로 나아가는 중요한 진전을 의미한다”며 “딥엘 보이스 투 보이스는 다국어 커뮤니케이션 과정에서 발생하는 불필요한 마찰과 부담 없이 누구나 자신의 언어로 자연스럽게 대화할 수 있도록 돕는다”고 말했다.
정현정 기자 iam@etnews.com