플리토, 국립국어원 韓·외국어 병렬 말뭉치 구축 5년 연속 참여

플리토, 국립국어원 韓·외국어 병렬 말뭉치 구축 5년 연속 참여

인공지능(AI) 언어 데이터 기업 플리토가 국립국어원 '한국어·외국어 병렬 말뭉치 구축 사업' 수행기업으로 5년 연속 선정됐다.

사업은 AI 시장에서 한국 언어문화 데이터 주권을 지키고 한국형 AI 기술 개발 지원을 목표로 한다. 플리토는 1차 중장기 5개년 계획 사업에 빠짐없이 참여한 유일한 기업이다. 누적 수주 약 115억원, 총 구축 어절 약 5500만개를 기록했다.

올해는 경희대 산학협력단과 함께 참여하는 형태로 총 사업 규모 약 42억원 중 플리토는 20억9000만원 규모 병렬 말뭉치 구축을 맡는다. 베트남어, 인도네시아어, 태국어, 힌디어, 크메르어, 타갈로그어, 러시아어, 우즈베크어, 영어 등 9개 언어에 대해 총 900만 어절 병렬 말뭉치를 구축할 계획이다.

구축된 언어 데이터는 번역 소프트웨어와 자연어처리(NLP) 기술을 비롯해 AI 기반 언어문화 산업 발전을 위한 정부 주도 기술 개발에 활용될 계획이다. 국가 간 활발한 언어문화 교류에도 기여할 전망이다.

이정수 플리토 대표는 “플리토의 언어 데이터 구축 경험과 전문성을 인정받아 5년 연속 사업을 수행하게 됐다”며 “정부가 육성하는 언어 데이터 산업에서 차별화된 고품질 언어 데이터를 지속 공급, 한국형 AI 기술이 글로벌 경쟁력을 갖추는 데 선도적 역할을 하겠다”고 말했다.

구축된 언어 데이터는 국립국어원이 운영하는 언어정보나눔터 통합시스템 모두의 말뭉치에서 확인할 수 있다.

박종진 기자 truth@etnews.com

AI