KETI, 첨단 언어처리 모델 'KE-T5' 선봬

KETI, 첨단 언어처리 모델 'KE-T5' 선봬

한국전자기술연구원(KETI)은 첨단 언어처리 모델 'KE-T5'를 선보인다고 28일 밝혔다.

KE-T5는 구글의 언어모델 알고리즘 T5를 기반으로 구축한 언어처리 모델이다. 한국어와 영어처리에 모두 활용 가능한 자기지도학습 방식 이중 언어처리를 할 수 있다.

KE-T5는 최초의 한국어 데이터 중심 T5계열 모델이자, 언어의 의미 인식 특성과 표현 특성을 모두 포함하는 범용 언어모델이다. 소수의 학습 데이터만으로 다양한 언어처리에서 높은 성능을 보여 구축비용 대비 높은 활용성을 자랑한다.

KETI는 텍스트 종류와 학습 규모에 따라 16종의 모델을 무상으로 배포하고, 개발자가 개발환경과 엔진 특성에 따라 선택해 활용할 수 있도록 지원한다. 또 24종의 한국어-영어 요약, 번역 모델들도 함께 공개했다. 이 언어모델들은 '아파치 2.0 라이선스'에 따라 자유롭게 사용 및 배포 가능하다.

이번 연구를 주도한 신사임 KETI 인공지능연구센터 센터장은 “영어 중심의 사전학습 언어처리 기술은 그동안 높은 구축비용으로 기업들에게 부담을 줬다”며 “KE-T5 규모를 지속 늘려 원천 언어처리기술 분야 발전과 사업화 지원에 앞장서겠다”고 밝혔다.

강해령기자 kang@etnews.com