[AI 사피엔스 시대]김종윤 스캐터랩 대표 “반려동물 대신 마음 달래주는 AI”

<사진=홍윤기 작가>
<사진=홍윤기 작가>

“인간은 타인과 관계형성, '소셜'에 대한 본능적인 욕구를 갖고 있습니다. 발전된 AI는 반려동물 이상으로 사람의 감정을 채워주는 역할을 수행할 것입니다.”

김종윤 스캐터랩 대표는 인공지능(AI) 자연어처리 기술 중 '오픈도메인 컨버세이션(비목적성 대화)'가 향후 반려동물 시장까지 상당 부분 대체할 것으로 내다봤다. 목적 수행이나 질의응답이 아닌 일상적 대화 기술을 의미한다. 영화 '그녀(her)'에서는 인간과 AI '사만다'가 수준 높은 감정을 나누는 세계관에 대해 표현된 바 있다. 동물과 달리 AI는 양육비가 들지 않는 데다 병이나 자연사로 사별할 염려가 없다. 자연스러운 일상 대화는 반려동물이 수행하기 어려운 부분이다.

김종윤 대표는 “음성합성, 음성인식 기술은 이미 상당한 수준에 이르렀다. 그럼에도 반려 서비스로 발전이 더뎠던 이유는 오픈도메인 대화능력의 부재 영향이 컸다”면서 “현재 발전 속도가 유지된다면 10대가 주로 사용하는 메신저용 '챗봇'과 노년층 대상 대화 서비스에서 2~3년 내 유의미한 지표를 보일 것”이라고 설명했다.

2011년 창업한 스캐터랩은 국내 스타트업 중 독보적인 자연어처리 기술을 보유하고 있다. 메신저 대화 분석 툴 '텍스트엣' 등을 통해 한국어 100억건, 일본어 10억건에 달하는 대화 데이터셋을 확보한 덕분이다. 국내는 물론 글로벌 기업 중에서도 이 정도 규모 실제 대화 데이터를 확보한 곳은 전무하다.

실제로 자연어처리 연구에서 가장 어려운 과제가 데이터셋 확보다. 대부분 기업은 위키피디아나 뉴스 등 공개 데이터를 통해 대화를 학습시킨다. 구글 역시 공개된 커뮤니티 게시판인 '레딧'을 주로 활용하는 것으로 알려졌다. 게시글 및 댓글, 대댓글 대화를 수집해 패턴을 학습시키는 것이다. 그러나 이는 실제 대화와 다소 간극이 있다.

김 대표는 “자연어 연구에서 대화 데이터는 수천, 수만건 수준이 아니라 기가바이트 단위로 투입해야 유의미한 결과가 나온다”면서 “게다가 스캐터랩 데이터 표본은 연인·친구 간 대화라 다양한 주제와 따뜻하고 친절한 대화를 학습시킬 수 있다는 장점이 있다”고 설명했다.

오픈도메인 분야는 일단 기술이 완성되면 대부분 대화형 AI에 적용이 가능하다. AI스피커나 로봇청소기와 농담을 주고받는 것도 가능하다. 정교한 외형을 갖추거나 높은 수준의 그래픽 기술에 자연어처리 기술이 조합되면 실제 사람과 대화하는 것과 차이를 느끼기 어려워진다. 사람에게서 얻지 못하는 정서적 안정을 AI가 치유하는 역할도 기대할 수 있다는 의미다.

이형두기자 dudu@etnews.com