GIST 대학원생팀, '2025 포케에이전트 챌린지' 준우승…AI 실력 입증

발행일 : 2025-12-08 09:56

'네 번째 레슨(4thLesson)' 팀. 왼쪽부터) GIST 석사과정 김경보·권은주·김유진·박상연 학생.

광주과학기술원(GIST·총장 임기철)은 AI융합학과 대학원생들로 구성된 '네 번째 레슨(4thLesson)' 팀이 세계 최고 권위의 인공지능(AI) 학회 '뉴립스(NeurIPS)'가 주관한 '2025 포케에이전트 챌린지'에서 '대전(배틀링) 트랙: 포켓몬 1세대 규칙 부문(Gen 1 OU*)' 준우승을 차지했다고 8일 밝혔다.

예선과 본선은 모두 온라인으로 진행됐으며 최종 결과는 7일 미국 캘리포니아주 샌디에이고에서 열린 '뉴립스(NeurIPS) 2025 컨퍼런스'에서 발표됐다.

'포케에이전트 챌린지'는 포켓몬 게임의 배틀 방식(포켓몬 선택, 기술 사용, 교체 전략 등)을 그대로 구현한 환경에서 AI끼리 대결을 시키며, AI가 불확실한 상황에서 얼마나 똑똑하게 판단하고 전략을 세우는지를 평가하는 국제 대회다.

GIST '네 번째 레슨(석사과정 김경보·권은주·김유진·박상연 학생, 지도교수 김경중)' 팀은 한정된 자원 속에서도 성능을 극대화하기 위해 이미 기본적인 능력을 학습해 둔 AI 모델을 출발점으로 삼아 필요한 부분만 추가로 학습시키는 미세 조정 전략을 선택했다. 학습이 더 안정적으로 이뤄지도록 하기 위해 기존 방식 대신 AI가 스스로 더 효율적으로 배울 수 있게 돕는 '크론(Kron) 옵티마이저'라는 새로운 학습 기법을 도입했다.

또한 시간이 지날수록 새로운 정보를 잘 익히지 못하는 '가소성 상실' 문제가 생기지 않도록 AID 기술을 적용해 학습 능력을 지속적으로 유지하도록 했다.

네 번째 레슨 팀의 가장 큰 강점은 데이터를 스스로 확장하는 능력이다. 약 19만 개의 기본 데이터세트만으로는 전략을 충분히 학습시키기 어렵다고 판단하고, 규모가 다른 19종의 AI 모델을 서로 반복해서 겨루게 하는 자체 실험 환경(로컬 래더 셋업)을 구축해 대량의 추가 학습 데이터를 직접 만들어 냈다.

이를 통해 약 135만 개의 고품질 추가 데이터를 확보하며 모델의 전략적 완성도를 크게 높였다.

이번 성과는 단순히 게임 AI의 승률 향상을 넘어, 데이터가 적거나 불확실성이 높은 상황에서도 강화학습(AI가 시행착오를 통해 스스로 배우는 방식)이 효과적으로 작동하게 하는 방법론을 제시했다는 점에서 의미가 크다.

김경중 지도교수는 “학생들이 한정된 자원 속에서도 창의적 전략과 치밀한 실험 설계를 바탕으로 국제적인 성과를 이뤄냈다”며, “이번 준우승은 GIST AI융합학과의 연구·교육 수준이 세계적으로도 경쟁력을 갖추고 있음을 보여주는 결과”라고 말했다.

이어 “강화학습의 한계를 보완하기 위한 새로운 최적화 알고리즘과 활성화 기법을 과감하게 적용한 시도가 결실을 맺었다”며, “앞으로도 학생들의 도전적 연구를 적극 지원하겠다”고 덧붙였다.

김영준 기자 kyj85@etnews.com