[기고]AI 기술 활용을 위한 VUI 설계 전략

유플리트 천정열 기술이사
유플리트 천정열 기술이사

현재 인공지능(AI) 시장에선 음성비서를 중심으로 치열한 생태계 구축 경쟁이 벌어지고 있다. AI를 표방한 음성비서, AI스피커, 스마트홈, 챗봇 등 다양한 제품과 서비스가 출시되고 있고 생활, 금융 등 다양한 플랫폼에 접목돼 발전하고 있다.

초기 음성인식 제품과 서비스는 단순한 검색 기반 위주였다. 음성인식 프로세스가 단순 검색 프로세스와 비슷했기 때문이다. 물론 기술적으로 훨씬 더 복잡하고 정교함을 요구하지만 단순한 동작과 구조 체계로 인해 제약이 있었다. 하지만 기술 발전에 따라 적용 범위가 넓어졌고 생활, 금융 등 다양한 플랫폼에 접목되면서 사용자와 플랫폼 관점에서 고려해 할 것이 훨씬 많아 졌다.

음성명령을 인지하고 수행하는 UI를 VUI(Voice User Interface)라고 한다. 현재 VUI는 기술 발전에 따른 과도기 단계에 있다. 제품과 서비스에 대한 사용자 인터렉션을 완전히 음성으로 제어하기보다 전통적인 터치 방식의 인터렉션을 보조하는 수단으로 활용되고 있다. 기술적 한계로 인한 제약과 서비스 플랫폼에 종속되는 보조적인 형태 때문이기도 하다.

화면 터치 방식의 인터페이스는 사용자 단계별 선택과 입력을 순차적으로 실행하기 위한 정보 구조의 체계화와 단계별 선택 요소를 명확하게 나열하는 화면 중심 설계가 중요했다.

하지만 VUI에서는 사용자와 대화를 진행하면서 바로 최종 결과에 도달하기 때문에 화면 표시를 위한 UI 설계보다는 대화(명령) 맥락을 이해하고 정확한 정보에 도달하도록 하는 서비스 시나리오 관점의 설계가 더 중요하다.

먼저 사용자 준비 단계를 인식하고 서비스 활성화를 위한 시작 단계를 고려해야 한다. 시중 대부분 제품과 서비스는 정해진 음성 '키워드'나 디바이스 터치를 통해 사용자 준비 단계를 인식한다. 구글 어시스턴트는 '오케이 구글', 애플 시리(Siri)는 '헤이 시리' 등과 같이 음성 '키워드'를 통해 준비 단계를 인식한다.

단일 제품이나 서비스 경우에는 이러한 준비 단계가 효과적일 수 있으나 서비스 플랫폼 안에서 부가 기능으로 제공되는 음성인식 서비스의 경우에는 이러한 방식이 주요 서비스의 사용자 인터렉션을 방해해 적절하지 않을 수 있다. 따라서 주요 서비스나 플랫폼 관점에서 진입을 위한 자연스러운 사용자 인터렉션이 제공되도록 설계돼야 한다.

다음은 사용자 맥락을 유도하는 다양한 서비스 시나리오가 설계돼야 한다. 사람의 대화는 단편적이지 않고 많은 맥락을 내포한다. 질문의 의도와 맥락에 맞게 대응하는 다양한 시나리오 설계가 중요하다.

이러한 방법으로 사용자의 주도권을 시스템이 확보하도록 정해진 시나리오 기반으로 질문(대화)을 유도하거나, 사용자 선택을 미리 제어, 계획한 시나리오로 유도할 수 있다. 이때 연계 정보나 질문을 함께 노출하고 단답형 선택으로 유도하는 방법은 정확성을 높일 수 있지만 반복되는 질문과 단계가 많아지면 사용자 피로감이 증가, 서비스 경험이 반감된다.

음성인식 서비스는 여러 기술과 서비스의 집합체며 개방형 네트워크 특성을 가진다. 다양한 서비스와 자연스럽게 연결되면서 서비스를 확장할 수 있는 요소가 많다는 의미다. VUI 정교한 설계와 사용자경험 전략은 사용자를 다양한 플랫폼에 자연스럽게 연결하고 소비와 서비스 플랫폼을 동시에 발전시킨다.

사용자를 이해하지 못한 기술이나 서비스는 외면 받기 쉽다. 개별 단위 경험보다는 통합 브랜드 경험을 제공할 수 있도록 하고 사용자 접점을 서비스 플랫폼으로 확대해 제품이나 서비스 경쟁력을 높이는 전략이 필요하다.

천정열 유플리트 기술이사 frommail@upleat.com