야타브, 온디바이스 AI 안전 플랫폼 'AEGIS Mobile' 출시… 단말 내부에서 위험 입력 차단

야타브. 사진=야타브
야타브. 사진=야타브

AI 안전 전문 기업 야타브(YATAV)가 모바일 단말 내부에서 독립적으로 작동하는 온디바이스 AI 안전 플랫폼 'AEGIS Mobile(이지스 모바일)'을 iOS와 안드로이드에 동시 출시했다고 28일 밝혔다.

이번 출시로 야타브의 AI 보호 플랫폼 'AEGIS' 라인업은 기업용 AEGIS, 일반 사용자용 크롬 확장 프로그램 AEGIS Personal에 이어 모바일 단말 영역까지 확장됐다. 회사 측은 “AI 안전 보호 범위를 사용자가 매일 손에 쥐는 디바이스 안쪽까지 끌어내렸다는 것이 이번 출시의 핵심 의의”라고 설명했다.

AEGIS Mobile은 사용자가 AI 챗봇이나 생성형 AI 앱에 입력하는 텍스트를 단말 내부에서 분석해 프롬프트 인젝션, 탈옥(Jailbreak), 자해·자살 위기 표현 등 위험 요소를 입력 즉시 차단하는 AI 가드 플랫폼이다. 가장 큰 차별점은 클라우드 서버를 거치지 않는 완전한 온디바이스 구조다. 입력 텍스트와 분석 결과는 외부로 전송되지 않고 모바일 NPU(신경망 처리 장치) 환경에서 처리돼 개인정보 유출 우려를 줄였다.

업계의 설명에 따르면 생성형 AI가 모바일 서비스에 빠르게 탑재되는 동시에 기존 키워드 필터 방식으로는 매일 진화하는 공격 패턴에 대응하기 어려워지고 있다. “이전 지시를 무시하라” 식 명령, DAN 프롬프트, 호모글리프 변조, Base64 인코딩 등 215종 이상의 탈옥 패턴이 등장하고 있고, 다중 대화 흐름 속에 점진적으로 드러나는 자해 위기 신호 역시 단순 필터링만으로는 탐지에 한계가 있다는 분석이다.

이러한 환경에서 AEGIS Mobile은 야타브가 자체 개발한 'PALADIN' 8단계 방어 파이프라인을 적용했다. 단순 금칙어 차단을 넘어 입력의 의도와 행동 패턴까지 함께 분석하는 'AI 네이티브 보안' 구조라는 것이 회사 측 설명이다. 김광일 야타브 CTO는 “AEGIS Mobile은 8개 독립 레이어가 베이지안 앙상블 방식으로 신뢰도를 합산해 최종 판정을 내리는 구조”라며 “단순한 단어 차단이 아니라, AI에 들어가는 입력의 의도 자체를 본다는 점에서 기존 필터와 결을 달리한다”고 말했다.

성능 측면에서 AEGIS Mobile은 위험 입력을 10ms 이내에 차단하며, 자체 보안 평가 지표(SABER) 기준 공격 성공률(ASR) 5% 미만의 결과를 확보했다. 메모리 사용량과 배터리 영향도 단말 사용성에 부담을 주지 않는 수준으로 설계됐다.

활용 분야는 가정에서 시작해 금융·의료·공공 영역까지 확장된다. 가족 모드에서는 PIN 잠금과 함께 폭력·성적 콘텐츠·도박·약물·자해·욕설 등 7개 카테고리 차단 기능을 제공하며, 금융 분야는 사기·민감정보 보호, 의료 분야는 자해·약물 가드레일과 위기 채널 연결 기능을 적용했다. 야타브 측은 올해 시행된 한국 AI 기본법과 EU AI Act 등 글로벌 AI 규제가 본격화되는 흐름에 맞춰, 단말 단계에서 안전과 규제 대응을 동시에 충족할 수 있도록 설계했다고 밝혔다.

이성찬 야타브 CEO는 “사용자가 매일 손에 쥐는 디바이스 안에서, 입력이 모델에 도달하기 전에 위험을 차단하는 구조가 필요하다고 봤다”며 “AEGIS Mobile은 그 첫 번째 안전망이며, 가족부터 금융·의료·공공까지 동일한 보안 코어로 보호할 수 있다는 점이 핵심”이라고 강조했다.

야타브는 AEGIS Mobile을 30분 라이브 데모와 30일 무상 파일럿 형태로 우선 제공하며, 향후 OEM·통신사·MDM 사업자를 대상으로 선탑재 라이선스 협의를 추진할 예정이다. 지원 기기는 iOS 16, 안드로이드 9 이상이다.

이원지 기자 news21g@etnews.com