“비속어 없어도 문맥으로 문제점 판단” 카카오 AI, 한국어 실력 늘었다

카카오엔터프라이즈
<카카오엔터프라이즈>

카카오가 한국어 인공지능(AI) 기술을 고도화한다.

카카오엔터프라이즈는 한글날을 앞두고 비속어가 포함돼 있지 않아도 사회적 문제를 일으킬 가능성을 미리 파악할 수 있는 머신러닝 모델을 AI 대화 서비스에 적용 중이라고 7일 밝혔다.

김응균 카카오엔터프라이즈 AI랩 자연어처리팀장은 “2017년 AI플랫폼 '카카오i' 출시와 동시에 '아일랜드 필터'라는 기술을 활용해 형태소 분석과 텍스트 일치 방식으로 비속어를 걸러냈다”면서 “올해부터 추가로 비속어가 포함되지 않아도 사회·윤리적으로 논란을 일으킬 수 있는 문장을 스스로 판단하는 머신러닝 모델을 적용했다”고 말했다. AI 혐오 표현으로 문제가 된 '이루다 사태' 같은 논란을 예방할 수 있다는 것이다.

카카오는 AI 스피커 등 대화형 서비스에서 한국어 자연어처리 기술을 적극 사용하는 기업 중 하나다. 올해 하반기부터 기술 수준을 한 단계 높인 상용 서비스를 내 놓는다.

카카오엔터프라이즈는 연내 출시를 추진하는 콘택트센터 솔루션에 순차적으로 첨단 기술을 녹인 한국어 AI 기술을 적용할 계획이다. '디플로(DFLO)' 프로젝트가 그것이다.

디플로는 고도화된 음성인식(STT), 음성합성(TTS), 대화 엔진을 기반으로 AI가 사람을 대신해 전화 예약을 받거나 주문을 받는 기술이다. 사람과 사람 사이 대화나 일을 거부감 없이 대신 수행할 수 있는 기반 기술을 확보하고 이를 다양한 분야와 접목하는 취지로 시작한 카카오엔터프라이즈 내부 프로젝트다.

디플로는 이용자 발화를 인식하거나 이해하는 단계에서 나아가 대화 콘텍스트까지 파악한다. 이용자가 필요로 하는 다음 액션까지 제시하거나 대행해 일상에 새로운 경험과 가치를 제공하는 것이 목표다.

김세미 카카오엔터프라이즈 대화형플랫폼파트 PM은 “디플로는 기존 챗봇 구조에서 벗어나 '봇 드리븐 플로우'가 가능한 형태”라면서 “특정 목적을 달성하기 위해 필요한 것들을 유저가 하나하나 묻고 달성해내는 형태가 아니라 봇 주도로 자연스러운 대화 맥락 속에서 대화 목적을 달성하는 것이 가능하다”고 설명했다.

카카오엔터프라이즈는 최근 대량 학습 데이터를 확보해 언어 모델 연구개발에 박차를 가하고 있다. 카카오톡 채널을 개발·운영하며 쌓아온 문서 분류와 검색 관련 AI 기술을 적극 활용한다.

'퓨샷러닝'이 대표적이다. 기존 딥러닝 모델보다 적은 데이터로 학습이 가능한 방식이다. 김 팀장은 “개별 도메인에 특화된 모델은 높은 성능을 낼 수 있지만 학습에 필요한 데이터를 충분히 확보해야 되는 것이 난제”라면서 “이 같은 문제를 해결하기 위해 GPT3 같은 빅모델을 활용한 퓨샷러닝이 주목받고 있고 카카오엔터프라이즈도 관련 연구를 활발히 이어나가고 있다”고 설명했다.

대화 주제가 열려 있는 비목적성 대화도 카카오엔터프라이즈가 집중하는 연구 분야다. 실제 사람과 사람 간 대화를 보면 특정 목적·주제를 이야기하는 시간보다 일상 대화나 상대방과 감정 교류를 위한 '스몰토크'가 많다.

김세미 PM은 “비목적성 대화에서 △특정 사실이나 지식을 기반으로 답변을 생성하는 기술 △발화 데이터를 기반으로 발화자 감정값을 탐색하는 기술 △이전 대화 문맥을 사용해 여러 답변 후보 중 가장 적합한 발화를 선택하는 기술에 주목하고 있다”고 말했다.

김시소기자 siso@etnews.com