오픈AI 'GPT-5.5', 英 AI 보안 평가서 미토스 제치고 최고 성능 기록

오픈AI 홈페이지 메인화면 'GPT-5.5' 이미지.
오픈AI 홈페이지 메인화면 'GPT-5.5' 이미지.

오픈AI의 최신 생성형 AI 모델 'GPT-5.5'가 영국 정부 산하 AI 안전연구소(AISI)의 사이버 보안 역량 평가에서 최상위권의 성적을 거둔 것으로 나타났다.

17일(현지시간) AISI 공식 홈페이지에 게재된 평가 보고서에 따르면, GPT-5.5는 전문가 수준의 사이버 보안 과제 평가에서 71.4%의 평균 통과율을 보였다. 이는 오픈AI의 전작인 GPT-5.4(52.4%)를 비롯해 앤트로픽의 클로드 미토스 프리뷰(68.6%), 클로드 오퍼스 4.7(48.6%) 등 경쟁 모델들의 기록을 모두 웃도는 수치다. AISI 측은 GPT-5.5를 두고 “이번 사이버 과제 테스트에 참여한 모델 중 가장 강력한 성능을 지녔을 가능성이 있다”고 총평했다.

이번 조사는 암호 분석, 웹 공격, 리버스 엔지니어링, 익스플로잇, 취약점 연구 등 AI의 사이버 보안 능력을 다각도로 검증하기 위해 마련된 총 95개 과제로 진행됐다.

특히 GPT-5.5는 AISI가 고안한 기업 네트워크 침투 모의실험인 '더 라스트 원스'의 전 과정을 완수한 역대 두 번째 모델로 이름을 올렸다. 해당 시뮬레이션을 최초로 통과했던 모델은 앤트로픽의 클로드 미토스 프리뷰다. '더 라스트 원스'는 단순한 지식 보유 여부를 넘어 AI가 자율적인 공격 에이전트로서 발휘할 수 있는 위협 수준을 측정하는 핵심 기준이다.

총 32단계로 짜인 이 기업망 공격 시뮬레이션은 AI 에이전트가 아무런 권한이 없는 공격 환경에 투입되어 정찰, 자격증명 탈취, 내부망 이동, 공급망 우회, 내부 데이터베이스(DB) 유출에 이르는 모든 공격 과정을 스스로 탐색하고 실행하도록 유도한다. AISI는 사람이 이 과제를 완수하려면 약 20시간이 소요될 것으로 추정했다. GPT-5.5는 총 10번의 시도 중 2차례 전체 과정을 마쳤으며, 앞서 클로드 미토스 프리뷰는 동일한 조건에서 3차례 성공한 바 있다.

다만 GPT-5.5 역시 산업제어시스템(ICS) 공격 모의실험인 '쿨링 타워' 과제는 해결하지 못했다. 연구소에 따르면 현재까지 이 과제를 완전히 끝낸 AI 모델은 전무한 상태다.

AISI는 이번 평가가 통제된 실험실 환경에서 이루어진 만큼, 실제 출시된 서비스에서 일반 이용자가 쓸 수 있는 기능을 고스란히 대변하는 것은 아니라고 선을 그었다. 실제 배포되는 모델에는 모니터링, 접근 통제, 추가 안전장치 등이 결합되며, 이번 실험 환경 또한 실제 기업의 보안망처럼 탐지 도구, 방어자, 경보 대응 체계 등이 완벽히 구현된 것은 아니라는 설명이다.

동시에 AISI는 AI 모델의 사이버 공격 능력이 코딩 능력 향상, 추론, 장기 자율성과 맞물려 급속도로 발전하고 있다고 짚으며, 머지않은 시기에 추가적인 성능 향상이 이어질 수 있다고 내다봤다.

박종진 기자 truth@etnews.com