정부의 독자 인공지능(AI) 파운데이션 모델 1차 압축이 이르면 사흘 앞으로 예고된 가운데 발생한 외부 인코더 활용 논란이 여러모로 씁쓸함을 남긴다. 본지 취재를 종합하면, 정부가 이번 독자 AI 개발 프로젝트를 진행하면서 외부 인코더나 가중치 사용은 불가하다고 분명히 사전 고지했던 것으로 밝혀졌다.
논란에 휩싸인 네이버클라우드 측은 중국 알리바바 AI 모델 큐엔(Qwen)의 '비전 인코더'를 활용했음을 인정하면서도 자사 지향 모델이 텍스트는 물론 음성·시각까지 포괄하는 옴니모달인 만큼 오픈소스 격 외부 인코더 활용은 일반적 허용 범위 안에 있다는 입장이다.
이같은 논란을 명쾌하게 정리할 수 있는 기준은 분명하다. 사업공모로부터 지난해 9월초 5개 컨소시엄 선발까지 촉박한 기간동안 평가 받을 초기 모델을 내놓기까지, 거기서 또 3개월 뒤 지난해 연말 1차 발표 진전까지 외부 인코더를 활용한 것을 개발 적정성을 따져보는 것이 우선이다.
사실, 이 부분은 엄격히 따져보면 정부의 명확한 사전고지가 있었기 때문에 규정 위반 소지가 크다. 더구나 같은 조건의 다른 4개 컨소시엄은 독자 인코더를 사용한 만큼 어떤 범위의 활용이라 하더라도 정당성을 인정 받기 힘들어졌다.
하나 더 남은 평가 기준은 외부 인코더나 가중치를 일부 활용했더라도 나올 수 있는 최종 모델 성능이 압도적이라면 다른 얘기가 된다. 정보기술(IT) 제품 개발시, 일본 기존 프로그램이나 오픈소스를 활용해 작업을 했더라도 완전히 다른 차원의 성능이 구현된다면 속칭 베끼기 논란에선 자유로워 진다.
개발 완료된 AI 모델의 성능과 성과가 '원용된' 것과 비교할 수 없을 정도로 뛰어나다면 범용성 차원에서나, IT 개발 특성상 용인될 수 있는 범위에 들어간다.
결과적으로 이런 두가지 기준을 갖고 경쟁 컨소시엄간에도 납득할 수 있는 엄정한 평가 결과를 내놓은 것이 중요하다. 그래야만 독자 AI파운데이션 개발의 철학적 가치인 '소버린 AI'에 대한 국민적 이해도 가능해질 것이다.
개발과 진전에는 늘 입방아가 오간다. 하물며 대한민국 자존심을 담은 독자AI 개발 작업이라면 오죽하겠는가. 다행히 서바이벌 오디션 방법의 선발 과정을 거치기로 했으니, 오히려 다행한 일이 될 수도 있다.
논란 확산을 막을 최선의 방법은 가장 엄격하고, 공정한 기준을 갖고 평가한 결과를 내놓는 일이다.
editorial@etnews.com