
드론이나 로봇에 탑재된 인공지능(AI) 에이전트는 상호 협동이 필수다. 악천후나 센서가 고장 나는 상황에서도 협력 구조를 유지해야 주어진 역할을 수행할 수 있기 때문이다.
한승열 울산과학기술원(UNIST) 인공지능대학원 교수팀은 모의 위기 상황을 만들고 이를 AI 에이전트에 '예습'시켜 실전에서 견고한 협력 체계를 유지할 수 있는 기술을 개발했다.
다중 에이전트 협력 구조를 단계적으로 무너뜨리는 인위적 오작동 공격 전략 '울프팩 어택(Wolfpack Attack)'과 이를 학습에 활용하는 방어 프레임워크 '월(WALL)'이다.
강화학습은 AI가 다양한 상황을 경험하며 스스로 행동 전략을 익히는 방식이다. 여러 AI 에이전트를 협력하게 만드는 다중 에이전트 강화학습(MARL)은 하나의 에이전트에 문제가 생겨도 나머지가 이를 보완해 전체 성능을 유지한다.
하지만 단일 에이전트를 무작위로 교란하는 공격 방식으로는 협력 체계의 취약점을 제대로 평가하기 어렵다. 센서 고장, 날씨 변화, 의도적 해킹 같은 현실적 위기 상황에 대한 훈련 효과도 제한적이다.

울프팩 어택은 하나의 에이전트를 오작동시킨 뒤 그를 도우려는 나머지 에이전트까지 연쇄적으로 문제를 일으켜 전체 협력 구조를 붕괴시키는 방식이다. 늑대의 사냥 방식을 모방했다.
기존에는 정해진 상황에서 AI가 얼마나 잘 작동하는지를 점검했다면 울프팩 어택은 실제처럼 상황이 계속 바뀌고 예측하기 어려운 상황에서 AI가 얼마나 잘 대응하는지 평가한다.
월은 울프팩 어택에 대응한 방어 학습 구조다. 월을 학습한 AI는 위치 오류나 통신 지연 같은 상황에서도 서로 부딪히지 않고 목표 지점에 도달하거나, 함께 물체를 밀고 진형을 유지하는 등 높은 적응력과 안정적 협력 성능을 나타냈다.
한승열 교수는 “협력형 AI 모델의 정확한 성능 평가와 위기 상황에 강한 협력 AI모델을 만드는 데 활용할 수 있다”며 “자율 드론, 스마트 팩토리, 군사·재난 현장의 군집 로봇 발전에 기여할 수 있을 것”이라고 말했다.
이번 연구는 과기정통부와 정보통신기획평가원(IITP) '지역 지능화 혁신 인재 양성사업'과 '사람 중심 AI 핵심 원천기술 개발사업'의 지원을 받았다.
울산=임동식기자 dslim@etnews.com