[이머징이슈]스마트TV 인터페이스

“거울아 거울아 세상에서 누가 제일 예쁘니?” 동화가 아닌 현실에서도 당신은 마법을 부릴 수 있다. 단 `거울`이란 단어를 `TV`로 바꾼다면 말이다.

스마트TV 시대가 왔다. TV가 음성을 인식해 프로그램을 보여주고 움직임에 반응한다. TV 제조사는 물론이고 유료방송사업자도 스마트TV(스마트셋톱박스) 개발에 한창이다.

ETRI가 개발한 `미러형 스마트 리모컨`. 내년 상용화할 계획이다.
ETRI가 개발한 `미러형 스마트 리모컨`. 내년 상용화할 계획이다.

스마트TV는 웹과 앱 스토어 플랫폼 기반으로 웹 영상물과 애플리케이션 등 콘텐츠를 제공하는 TV. 과거 MS 등 웹TV에서 애플TV, 삼성 커넥티드TV를 거쳐 새로운 스마트TV로 진화 중이다.

올해 말 TV플랫폼이 표준화된다. 방통위는 HTML5에 기반을 둔 TV플랫폼 표준화를 본격 추진 중이다. 그동안 IPTV와 스마트TV 등 사업자별로 플랫폼이 특정 운용체계(OS)에 종속돼 콘텐츠 시장이 파편화되고 앱 개발이 불편했다. 이는 개발 비용을 높였다. TV플랫폼이 표준화되면 전 세계 개발자가 올리는 수많은 앱과 웹 콘텐츠가 수시로 이용 가능할 전망이다.

문제는 기존 스마트TV가 아직 사용자 친화적이지 않다는 점이다. 다양한 스마트 단말이 대중화됐지만 인간 중심 사용자 환경(UI·UX)은 미흡하다. 스마트TV를 향해 “거울아, 거울아 세상에서 누가 제일 예쁘니?”라고 물어도 정확하게 TV가 대답할 수 없는 것이 현실이다.

많은 스마트TV의 음성인식 능력도 생각보다 떨어진다. TV 화면을 보며 리모컨으로 하는 인터넷 이용도 불편하다. 즉 말이 `스마트`지 아직은 완벽히 `스마트`한 TV는 아닌 셈이다.

오승곤 방송통신위원회 융합정책과장은 “스마트TV의 핵심은 얼마나 사용자 친화적인지로 결정될 것”이라며 “아무리 TV가 스마트해도 사용하기 불편하다면 이를 사용하는 사람은 거의 없을 것”이라고 말했다.

◇말을 하면 TV가 알아서 해주는 음성인식 기술

대표적 음성인식 기술로는 애플의 개인비서 서비스 `시리(Siri)`와 구글의 `마젤(Majel)` 등이 있다. 자동통역 서비스로는 `구글 번역` 앱이 있다. 이는 60여개 언어의 텍스트 번역 서비스를 지원한다. 이 중 주요 언어는 입력되는 음성을 문자로 바꾼 다음 자동으로 번역해 준다. 국내에서도 한국전자통신연구원(ETRI)이 2011년부터 제주도에서 관광과 여행 분야를 대상으로 한영 통역 시범 서비스를 시행 중이다. 2012년 여수 엑스포 기간 동안에도 통역 서비스를 시행한 바 있다.

일반적으로 사용자가 만족하는 자동통역 성공률 요구 수준은 90% 이상이다. 그러나 국내외에서 제공되는 서비스는 아직 75~85% 수준에 머물려 지속적 연구개발이 필요하다.

인간 중심 사용자 환경 발전을 위해서는 동작 인식, 시점 제어 등이 핵심 과제다. 이유는 사람마다 목소리가 다른데 기계는 목소리가 다른 것인지 발음이 다른 것인지 구별하지 못하기 때문이다. 또 여러 사람이 이야기하면 이들 소리를 분리해서 받아들이는 능력이 필요하지만 기계는 섞여서 들어오는 소리를 잘 분리하지 못한다.

특히 사람 머릿속에서 벌어지는 복잡한 과정을 기계가 따라잡기 어렵다. 그래서 소음과 음성을 구분하는 기술, 문장 속 여러 낱말 중 핵심어만 집어내는 기술, 연속 음성 인식 등 여러 기술을 국내외에서 개발 중이다.

◇손뼉 한 번에 TV가 켜지는 몸짓 인식 기술

손가락만 까딱 올리면 채널이 올라간다. 손뼉 한 번에 TV가 켜지고 두 번에 꺼진다. 먼 미래 기술이 아니다. 지금도 비슷한 기술은 많다. 문제는 정확성이다.

정확한 제스처 센서 기술은 사용자 친화적인 스마트TV 환경에 필수다. 카메라를 이용한 제스처 인식 방법에는 일반 영상 카메라를 사용하는 방법과 3D 뎁스(Depth)카메라를 사용하는 방법으로 구분한다. 2D카메라를 사용해 제스처를 인식하는 방법은 오랜 기간 연구했으나 조명 환경과 배경 조건의 제약으로 안정적 성능 확보에 어려움이 있었다.

이를 위해 3D 뎁스카메라가 개발됐고 이를 활용한 제스처 인식 기술이 발전하고 있다. 3D 카메라를 활용한 제스처 인식 기술은 2010년 마이크로소프트에서 키넥트를 발표한 것을 기점으로 급속히 발전 중이다.

TOF 센서 기술도 비교적 정확한 제스처 인식 기술이다. TOF 센서는 적외선 파장을 전송한 후 피사체로부터 반사돼 되돌아오는 신호 수신까지 소요된 시간을 측정해 피사체까지의 거리를 계산해 내는 방식이다. TOF는 일반적으로 눈에 보이지 않는 적외선 파장을 보낸다. 주변 밝기에 상관없이 실내에서 사용 가능한 장점이 있다. 적외선 파장대가 포함돼 있는 조명이나 태양광이 존재하는 실외에서는 성능 저하로 사용이 불가능하다. 이런 단점이 보완된다면 정말 손짓만으로 반응하는 진짜 스마트TV를 만날 수 있다.

멀리서도 몸짓에 반응하는 스마트TV도 필요하다. 여러 기관과 회사가 원거리에서 사용자의 행동분석과 상황인지를 위한 제스처인식 연구 진행 중이다. ETRI는 3m 거리에서 맨손으로 제어할 수 있는 원거리 터치인터페이스를 개발했다.

◇스마트TV를 그대로 옮겨놓은 리모컨

`미러형(mirror) 스마트 리모컨`은 스마트TV의 불편함을 없앨 대표 기기다. 스마트TV는 마우스 기능이 있지만 일반인이 쓰기에는 다소 불편하다. 그래서 리모컨을 대체할 방법이 생겼다. TV 화면을 리모컨으로 그대로 가져오는 것이다. 작은 거울에 TV 속 화면이 다 보인다. TV를 만지듯 미러형 스마트 리모컨을 만지면 된다. ETRI는 `미러형(mirror) 스마트 리모컨` 개발에 성공했다.

홍진우 ETRI 차세대 스마트TV 연구단장은 “ETRI에서 개발 중인 미러형 리모컨이 거의 다 완료됐다”며 “현재 테스트 중이며 내년 상용화 예정”이라고 말했다.

◇TV가 내 머릿속으로, 뇌파인식까지

머지않아 손짓을 하지 않아도 말이 없이도 TV가 내 마음대로 작동될 수 있다. 이미 뇌파를 이용해 TV나 컴퓨터 작동에 성공한 사례가 많다. 미국 바이오센서 제조업체 뉴로스카는 뇌파 기반의 인터페이스 `마인드세트(MindSet)`를 상용화했다. 뇌파감지 센서가 부착된 헤드세트로 사용자의 의도를 인식할 수 있다.

미국 사이버키네틱스는 전신마비 환자의 머리에 센서 칩을 장착해 TV와 컴퓨터 조작에 성공했다. 국내 기술도 만만치 않다. ETRI는 심상 뇌파(전두엽 부위)를 이용한 2인 게임에 적용했다. 또 생체신호의 하나인 근전도(EMG)기반 `EMG휠체어`와 `EMG마우스`를 개발했다.

전지연기자 now21@etnews.com