크라우드웍스, '국가대표 AI' 학습용 고품질 데이터 공급

크라우드웍스 '데이터' 홈페이지.
크라우드웍스 '데이터' 홈페이지.

인공지능(AI) 테크 기업 크라우드웍스가 과학기술정보통신부의 '독자 AI 파운데이션 모델 프로젝트' 데이터 공급기업에 참여한다.

국가대표 AI 개발에 참여하는 네이버클라우드, 업스테이지, SK텔레콤, NC AI, LG AI연구원 등 5개 정예팀이 필요한 데이터를 지원한다.

크라우드웍스는 5개 개발팀이 AI 개발에 활용할 공동 데이터를 제공한다. 저작권 문제를 합법적으로 해결한 과학·기술·공학·수학 등 고차원 전문지식이 담긴 STEM 데이터셋과 국내 최다 규모 도서 데이터셋, 국내외 뉴스 데이터, 국어학 데이터 등 품질과 신뢰성을 안정적으로 확보한 고품질 AI 학습 데이터를 공급한다.

모든 데이터는 크라우드웍스가 직접 구축하거나 자체 검수 시스템을 통해 전문성과 품질을 검증했다. 데이터 정확도와 신뢰도를 높인 게 특징으로 개발팀 개발 방향에 따라 맞춤형 데이터셋을 공급할 수 있다.

김우승 크라우드웍스 대표는 “AI 모델 성능은 결국 데이터를 기반으로 결정된다”며 “국내외에서 인정받은 데이터 품질과 전문성을 바탕으로 개발팀의 성공적 AI 모델 개발에 기여할 수 있기를 기대한다”고 말했다.

박종진 기자 truth@etnews.com