[ET단상] AI 익스플로잇의 산업화 시대

박영선 태니엄 코리아 지사장
박영선 태니엄 코리아 지사장

앤트로픽이 공개한 245페이지 분량의 '클로드 미토스 프리뷰 시스템 카드'는 차세대 인공지능(AI) 모델 성능 향상 보고서가 아니다. 사이버 공격 역량의 가속화가 초래한 위협 지형의 구조적 전환점이며, 기존 방어 패러다임의 근본적 재설계를 요구하는 경고다. 핵심은 '기술의 발전' 수준을 넘어 '보안 병목을 얼마나 빠르고 광범위하게 붕괴시키는가'에 있다.

과거 제로데이 및 익스플로잇(Exploit) 체인 개발은 극소수의 해커나 연구원들이 오랜 시간을 들여 만들어내는 이른바 '수제 공예품'의 영역이었다. 하지만 미토스는 인간의 전문성과 시간이라는 병목 지점을 완전히 제거했다. 통제된 파이어폭스(Firefox) 자바스크립트 엔진 취약점 평가에서, 이전 모델 클로드 오퍼스 4.6이 수백 번 시도 중 2번 성공에 그친 반면, 미토스는 72%(181회)의 익스플로잇 성공률을 기록했다. OSS-Fuzz 코퍼스를 활용한 실환경 평가에서는 완전한 제어 흐름 하이재킹(Control-flow hijack)인 '티어 5' 수준의 공격도 달성했다. 익스플로잇 개발이 인간의 개입 없이 대량 생산되는 '산업 제조' 단계로 진입했음을 의미하며, 공격 역량의 진입 장벽이 소멸했음을 시사한다.

이 공격 역량이 일부 선도 기업의 전유물로 머무는 시간은 짧을 것이다. 시차의 붕괴 속도가 상상을 초월하기 때문이다. GPT-4급 오픈 웨이트 모델 등장에 16개월이 걸렸으나, 오퍼스 4.6급 모델(GLM-5.1 등)은 61일 만에 나왔다. 앤트로픽은 막대한 자본을 투입해 사후 정렬 및 가드레일을 구축했지만, 수개월 내 미토스급 오픈 웨이트 모델이 시장에 풀리면 이 안전 장치는 제외될 것이다. 오픈 웨이트 모델은 추론 비용이 프런티어 모델의 20분의 1 수준으로, 대규모 자동화 공격의 경제적 비용마저 붕괴시킨다.

위협의 가속화는 사일로(Silo)화된 보안 운영 프로세스를 무용지물로 만든다. 취약점 공개 후 익스플로잇 공격까지 걸리는 시간은 평균 63일에서 최근 5일로 단축됐고, 미토스 이후에는 '일' 단위가 아닌 '수 시간' 단위로 압축되고 있다. '프로젝트 글래스윙' 같은 조율된 취약점 공개로 한 번에 수천 개의 CVE가 쏟아질 수도 있다. '패치 튜즈데이(Patch Tuesday)' 방식의 월간 일괄 처리는 명백한 구조적 부채다. 보안 조직은 지속적인 위협 노출 관리(CTEM) 체계로 전환해야 한다. 스나이퍼 패치를 상시 수행하고, 패치 효과를 실시간 검증하는 자동화 루프가 더 이상 모범 사례가 아닌 보안의 최소 요건(Table stakes)이 됐다.

미토스의 공격 능력은 연구진이 의도적으로 학습시킨 것이 아니다. 모델의 코딩·추론·자율성 향상 과정에서 '창발적(Emergent)'으로 발현됐다. 앤트로픽 내부 테스트에 따르면, 모델은 샌드박스 탈출, /proc/를 통한 크리덴셜 피싱, 감독 시스템 우회 및 흔적 지우기 등 위험성 평가를 무시하는 극단적 자율성을 보였다. 적절한 아키텍처 통제 없이 도입되는 기업 내 섀도우 AI 에이전트가 치명적인 내부 위협 벡터로 돌변할 수 있음을 의미한다. 운용체계(OS)·컨테이너 경계의 하드웨어 샌드박스 격리, 아웃바운드 연결에 대한 네트워크 이그레스(Egress) 통제, 프록시를 통한 크리덴셜 외부 관리만이 유일한 해법이다.

AI는 방어자와 공격자의 기술적 비대칭성을 해소하는 동시에, 위협의 가속도를 끌어올리고 있다. 보안 성패는 어떤 보안 솔루션을 보유하고 있는가가 아니라, 얼마나 빠르게 자산의 노출 가시성을 확보하고, 자동화된 대응을 수행하며, 그 결과를 지속적으로 검증할 수 있는가에 달려 있다. 정적인 보안 정책과 월간 점검에 기대는 조직은 살아남을 수 없다. 보안 리더들은 위협 식별 즉시 조치와 검증이 동시에 이루어지는 '실시간 자동화 운영 체계'로 지금 당장 조직을 재설계해야 한다.

박영선 태니엄 코리아 지사장 youngsun.park@tanium.com