엔씨AI, 경량 최강 VLM '바르코 비전2.0 1.7B' 모델 공개

바르코 비전2.0 VLM 성능 벤치마크 그래프
바르코 비전2.0 VLM 성능 벤치마크 그래프

엔씨AI는 온디바이스 환경에서 구동 가능한 초경량 멀티모달 AI 모델 '바르코 비전2.0 1.7B'를 공개했다고 30일 발표했다. 이번 모델공개로 엔씨AI는 17억(1.7B) 파라미터의 작은 크기에도 불구하고 기존 경량 모델들을 뛰어넘는 수준의 성능을 보여주며 개인 디바이스에서도 고성능 멀티모달 AI를 활용할 수 있는 길을 열었다.

엔씨AI 바르코 비전 2.0은 이미지와 텍스트를 함께 이해해 질문에 답할 수 있는 차세대 인공지능 모델이다。 여러 장의 이미지를 동시에 분석할 수 있어 복잡한 문서나 표, 차트도 효과적으로 처리할 수 있는 비전언어모델(VLM)이다.

이번 경량 모델 공개는 16일 공개된 중형 모델 '바르코 비전 2.0 14B'에 이은 후속타다. 14B 모델은 공개 후 열흘 만에 1만회 가까운 다운로드를 기록하며 국내외 개발자들의 높은 관심을 끌었다.

바르코 비전 2.0 1.7B는 텍스트 처리, 한국어 성능에서 글로벌 톱 오픈소스 멀티모달 모델인 인턴VL3 2B, 오비스2 2B 등을 압도하며 동급 최고 모델임을 입증했다. 영문 텍스트 처리 MT벤치와 한국어 K-SEED, K-LLaVA벤치는 물론 광학문자 판독 CORD, ICDAR 등 다양한 벤치마크에서 글로벌 모델들의 성능을 훌쩍 넘었다.

바르코 비전2.0 VLM 성능 벤치마크 그래프
바르코 비전2.0 VLM 성능 벤치마크 그래프

바르코 비전2.0 1.7B는 여러 주요 벤치마크에서 2배 가까이 더 큰 규모의 국내 모델들과 어깨를 나란히하는 성능을 기록했다. 대학 수준의 지식을 검증하는 MMMU 벤치마크와 과학 차트 이미지 해석 능력을 평가하는 AI2D 벤치마크에서 카카오의 카나나 3B, 네이버의 하이퍼클로바 3B 등 3B급 멀티모달 모델들과 동등하거나 오히려 더 뛰어난 성능을 보였다.

또한 시각적 맥락에서의 수학적 추론 능력을 평가하는 MathVista 벤치마크와 멀티모달 AI의 종합적인 시각언어 기능을 평가하는 MM-Vet에서도 윗 체급의 모델들 사이에서 2위를 기록했다. 모델의 크기가 성능을 결정하는 절대적 요소가 아니라는 것을 보여준 NC AI의 기술력을 증명하는 사례다.

1.7B 파라미터의 경량 모델은 스마트폰이나 PC 등 개인 기기에서도 원활하게 동작할 수 있도록 최적화됐다. 이는 기존 멀티모달 AI가 대부분 클라우드 환경에서만 활용 가능했던 한계를 뛰어넘어, 개인 디바이스에서도 고성능 멀티모달 AI를 직접 활용할 수 있게 한다.

바르코 비전2.0 VLM 성능 벤치마크 그래프
바르코 비전2.0 VLM 성능 벤치마크 그래프

엔씨AI는 이번 1.7B 모델도 오픈소스로 공개한다. 앞서 엔씨AI는 국내 AI 생태계 발전과 연구 활성화에 기여하기 위해 바르코 비전 2.0 모든 모델을 연구용 오픈소스로 공개한다고 밝힌 바 있다.

현재 정부가 추진하는 '독자 AI 파운데이션 모델 프로젝트'에도 도전하고 있다. 이번 멀티모달 모델 개발 역량과 함께 패션, 게임, 미디어 등 다양한 산업군에서의 버티컬 AI 서비스 운영 경험을 바탕으로 전 국민의 AI 접근성을 높이고 국가 AI 경쟁력 강화에 기여한다는 계획이다.

이연수 엔씨AI 대표는 “경량 고성능 모델 개발 능력을 통해 다양한 국내 산업군의 경쟁력을 크게 높일 것”이라며 “바르코 비전2.0 1.7B는 AI 기술의 자립과 민주화를 위한 중요한 이정표로 앞으로도 더 많은 사람들이 쉽게 접근할 수 있는 고성능 AI 모델 개발에 최선을 다하겠다”고 말했다.

박정은 기자 jepark@etnews.com