[신년기획 2024]한국 AI 경쟁력, 챗GPT는 어떻게 평가했나

전자신문은 전문가들로부터 한국 AI 산업 경쟁력을 평가받기 전에 챗GPT3.5에게 먼저 질문을 던졌다. 챗GPT는 △연구개발(R&D) 활동 △산업생태계 △정부정책 및 지원 △국제협력 및 경쟁 △인재양성 및 유치 등 5개 항목으로 나눠 한국 AI 산업 경쟁력을 80점 이상으로 첫 점수를 매겼다. 전문가에게 배포한 서면질의서도 챗GPT3.5 답변을 기반으로 했다.

챗GPT3.5의 첫 답변은 종합평가 점수와 개별 항목 점수가 일치하지 않았다. 첫 질의에 대한 답변은 △연구 및 개발 활동 30점 △산업 생태계 25점 △정부 정책 및 지원 20점 △국제 협력 및 경쟁 15점 △인재 양성 및 유지 10점이었다. 학계의 활발한 R&D 활동에 유독 높은 점수를 줬다. 총점과 개별 항목의 합이 일치하지 않는다는 점을 고려해 개별 항목에 대한 배점을 지우고 전문가에게 질의서를 배포했다.

질의 수정을 거쳐 챗GPT3.5가 다시 내놓은 평가는 △연구 및 개발 활동 20점 △산업생태계 18점 △정부 정책 및 지원 19점 △국제 협력 및 경쟁 17점 △인재 양성 및 유지 16점으로 재조정된 90점이 나왔다.

같은 질문을 챗GPT4.0에 다시 던진 결과는 사뭇 달랐다. 챗GPT4.0은 3.5와 달리 세부 항목을 △기술혁신 및 연구개발 17점 △교육 및 훈련 프로그램 16점 △산업 분야에서의 AI 적용 15점 △정부지원 및 정책 16점 △국제 시장에서의 위치 15점으로 달리 평가했다. 총점도 79점으로 챗GPT3.5의 평가보다 낮았다. 챗GPT3.5는 2021년 1월까지의 정보만을 학습한 반면 챗GPT4.0은 최근의 트렌드까지 학습한 결과로 풀이된다. 이에 비춰보면 한국 AI 경쟁력이 큰 발전이 없었다는 평가도 가능하다.

특히 한국 AI 산업 경쟁력이 가장 약한 분야로 꼽힌 산업생태계(산업 분야에서의 AI 적용) 항목에 대해 챗GPT3.5는 “한국은 AI 기술을 적용한 다양한 산업 분야에서 선두 기업들이 등장하고 있습니다. 특히 제조업, 의료, 금융 등에서 AI 기술의 적용이 진행되고 있습니다”라고 평가했다. 반면 챗GPT4.0은 “제조업, 의료, 금융 등 다양한 산업에서 AI의 적용이 확대되고 있으나, 아직 모든 산업 분야에 균등하게 적용되지는 않았습니다”라고 평가했다.

류근일 기자 ryuryu@etnews.com