SK텔레콤, 국립국어원과 차세대 AI 언어모델 개발

데이비스 에릭 하트먼 SK텔레콤 랩장(왼쪽)과 정희원 국립국어원 어문연구실장
데이비스 에릭 하트먼 SK텔레콤 랩장(왼쪽)과 정희원 국립국어원 어문연구실장

SK텔레콤이 국립국어원과 한국어에 최적화된 차세대 인공지능(AI) 언어모델을 개발한다.

차세대 AI 한국어 모델은 사람 능력 수준으로 평가되는 최신 AI 언어모델 'GPT-3'와 유사한 성능을 발휘하는 '한국어 범용 언어모델(GLM)'이다. 언어 관련 문제풀이, 글짓기, 번역과 주어진 문장에 따라 간단한 코딩을 수행할 수 있는 GPT-3 기능을 한국어로 구현한다.

GLM은 일상 감성대화, 다양한 업종 고객센터 대화뿐만 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역에서 언어활동과 신산업 분야에 적용할 수 있다.

SK텔레콤이 개발하는 GLM은 국립국어원 언어정보를 활용, 1500억개 매개변수를 가진 거대 언어모델로 개발될 예정이다. GPT-3는 1750억개 매개변수로 GPT-2보다 100배 이상 크고 보다 높은 정확도와 넓은 활용도를 확보했다. GLM도 높은 정확성과 범용성을 가질 것으로 예상된다.

SK텔레콤은 연말까지 GLM 개발을 완료하고 모델 성능을 검증한 뒤 상용화를 진행할 예정이다. 다양한 서비스에 적용하고 한국어 언어모델 성능평가 방법 개발, 한국어 데이터 품질 평가 연구도 추진할 예정이다.

국립국어원은 '2021년 국어 정보처리 시스템 경진대회'를 SK텔레콤 AI 언어모델을 활용, AI 언어소통 능력을 겨루는 방식으로 개편해 한글 주간에 개최한다.

데이비스 에릭 하트먼 SK텔레콤 랩장은 “SK텔레콤은 한국어에 최적화된 AI 언어모델을 선제 개발, 한국어 정보화에 이바지하고 있다”며 국립국어원과 협력을 계기로 한국어 과학화와 세계화에 기여할 계획”이라고 밝혔다.

정희원 국립국어원 어문연구실장은 “앞으로도 AI 개발에 필요한 언어 정보자원을 지속 발굴, 관련 산업계와 학계에서 유용하게 활용되도록 시스템을 구축하겠다”고 말했다.

박종진기자 truth@etnews.com