[이내찬교수의 광고로 보는 통신역사]〈60〉미토스의 충격: 과연 인간이 AI를 닭장에 가둘 수 있을까

워게임 포스터(1983) & SK텔레콤의 ITC 융합 보안 광고.(2018.12)
워게임 포스터(1983) & SK텔레콤의 ITC 융합 보안 광고.(2018.12)
이내찬 한성대 경제학과 교수
이내찬 한성대 경제학과 교수

앤트로픽의 인공지능(AI) 모델 '미토스'가 던진 충격이 거세다. 브라우저·운용체계(OS)의 취약점(제로데이)을 대량으로 탐지하고 수십년 묵은 취약점까지 찾아냈다. 더 놀라운 것은 미토스가 공격 코드(exploit)를 구성하고 취약점을 연결해 접근 권한까지 얻어낸 것이다. 일부 사례에서는 브라우저·OS 내부의 보안 장치인 샌드박스를 우회하는 공격 체인마저 제시했다.

해킹이 국가전략 문제로 부상한 것은 로널드 레이건 미국 대통령 때다. 게임 서버를 찾던 고등학생이 미군 핵전쟁 시뮬레이션 시스템의 작동 스위치를 누르는 영화 '워게임즈(WarGames, 1983)'를 관람한 것이 계기였다. 이후 국가 차원의 사이버 보안 정책이 수립됐다.

미토스의 등장은 보안 혁신인 동시에 위기다. 취약점 탐색과 공격 설계가 자동화되면 인간의 호기심, 숙련 기술, 시행착오 및 장시간 잠복과 같은 고전적 해킹 방식의 문턱은 낮아질 것이다. 금융·전력·통신·물류 같은 핵심 인프라에 대한 위협 가능성은 커질 수밖에 없다. 앤트로픽이 미토스를 일반에 공개하지 않고 주요 정보기술(IT) 기업 및 공개 소스 보안 생태계와 협력(Project Glasswing)하는 이유도 여기에 있다.

미토스 사태는 인간·AI간 관계를 다시 생각게 한다. AI는 제한된 범위 안에서 주어진 목표를 효과적으로 달성한다. 문제는 인간이 당연하게 여기는 상식·규범이나 암묵적 조건을 이해하지 못한 채 인간의 의도에서 크게 벋어나는 행동을 취할지도 모른다. 이 같은 'AI 정렬(alignment) 문제'는 예컨대 '종이 클립을 최대한 많이 생산하라'라는 명령을 수행하기 위해 별생각 없이 모든 자원을 끌어모으려고 할 수도 있다는 것이다.

인간은 닭을 울타리에 가두어 생육하지만, 닭은 인간을 가두지 못한다. 도구를 사용하고 계획을 수립하고 시스템을 체계적으로 관리하는 인간의 능력을 이해하지도 따라오지도 못하기 때문이다. 그렇다면 과연 인간보다 넓게 탐색하고 멀리 계획하며 인간의 판단력까지 영향을 끼칠 수 있는, 곧 실현된다는 인류 지능을 능가하는 AGI를 과연 인간이 통제할 수 있을까.

인간의 건강에 영향을 미치는 의약품의 무해성을 식약청의 인가를 받듯이 알고리즘의 안전성 보장을 위한 사전 점검이 필수적이다. 나아가 기능을 일부러 낮추어 덜 똑똑하게 만드는 손상재(damaged goods) 식의 제공도, 이용자의 아이폰 탈옥과 같은 남용을 방지할 수 있다는 전제 아래, 고민해 볼 수도 있다.

해킹은 현재도 권한 최소화, 제로 트러스트, 피해 국지화라는 기본 원칙으로도 방지 못 하니 결국 AI 시대의 보안은 AI가 막게 할 수밖에 없을지 싶다. 그러나 방어 AI 자체도 침투 AI에 의해 감염될 수도 있고 스스로가 샌드박스에서 나오고자 할지도 모르기에 모든 방어를 전담시킬 수도 없다. 결국 방어 AI 역시 철저한 권한 제한과 감시 아래 두지 않으면 안 될 듯하다.

이내찬 한성대 경제학과 교수 nclee@hansung.ac.kr