국가AI전략위, 독파모 등 AI기업 '학습용 데이터 확보' 지원

지난해 12월 서울 삼성동 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 임문영 국가인공지능전략위원회 부위원장이 축사하고 있다. ⓒ박종진기자
지난해 12월 서울 삼성동 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 임문영 국가인공지능전략위원회 부위원장이 축사하고 있다. ⓒ박종진기자

국가인공지능전략위원회가 '독자 인공지능(AI) 파운데이션 모델'(독파모) 프로젝트에 참여 중인 국가대표 AI기업 4개사와 간담회를 개최했다.

2일 열린 회의에는 LG AI연구원, 업스테이지, SK텔레콤, 모티프테크놀로지스 등이 참석했다. 독파모 성공을 위한 핵심 요소 중 하나인 '데이터 확보' 관련 애로사항을 청취하는 자리였다.

LG AI연구원은 AI 경쟁력 핵심인 데이터 활용 확대를 위한 합리적 규제 정비의 필요성을 강조했다. 향후 저작권 등을 포함한 정부의 다양한 제도 개선 노력에 힘입어 민·관 합심으로 글로벌 경쟁력을 갖춘 독파모 개발에 박차를 가할 계획이다.

업스테이지는 한국어 AI 경쟁력 강화를 위한 데이터 인프라 구축 필요성을 제안했다. 국립중앙도서관 납본 도서 데이터화, 텍스트·데이터 마이닝(TDM) 면책규정 등 AI 학습 목적의 명확한 저작물 활용규정 마련, 국가 자격시험 풀이 해설 등 전문가 사고 과정 중심 데이터셋 구축 등을 예로 들었다.

SK텔레콤은 데이터 확보·활용 전반에 대한 개선방안을 제시했다. 정부의 공동 활용 데이터에 대해 별도 재가공 없이 학습에 직접 적용할 수 있도록 검증·정제 체계 고도화를 요청했다. 도메인 특화 데이터 확보, 한국어 평가 데이터셋 확충, 라이선스 문제 해소, 민감 정보 처리 부담 완화도 건의했다.

모티프는 개별 기업이 대규모 한국어 사전학습 데이터를 독자적으로 구축하기 어려운 현실을 지적했다. 국내 AI기업이 공통으로 활용할 수 있는 국가 차원 '고품질 한국어 사전학습 데이터셋' 구축과 운영을 제안했다. 실제 AI 모델 학습에 필수인 데이터 후처리·가공 등에 대한 지원 확대도 요청했다.

임문영 국가AI전략위 부위원장은 “독파모 프로젝트 성공이 모두의 AI, AI기본사회 구현의 출발점”이라며 “이를 위한 데이터 확보 문제는 특정 부처, 기관의 역할이 아닌 범국가 차원 숙제”라고 강조했다. 이어 “해결하기 위한 역량 결집과 속도감 있는 실효적 지원에 위원회가 앞장서겠다”고 말했다.

박종진 기자 truth@etnews.com