[창간43주년] 카카오, 자체 AI 모델 '카나나' 오픈소스 공개…초거대 모델 개발 박차

카카오는 인공지능(AI) 기술 경쟁의 빠른 흐름 속에 자체 개발 AI 모델과 서비스로 생태계 확장에 기여하고 있다. 자체 모델 '카나나(Kanana)' 2.0을 개발 중이며, '에이전틱 AI(Agentic AI)' 모델 개발 전략도 설계했다.

카카오는 AI 기술 고도화를 위해 꾸준히 자체 AI 모델을 연구·개발해 왔다. 자체 개발한 AI 모델 카나나는 거대언어모델(LLM)과 멀티모달 언어모델(MLLM)을 비롯해 비주얼 생성모델, 음성모델 등 크기 및 종류, 특성에 따른 하위 모델을 갖췄다.

지난해 모델 라인업을 처음 공개한 이후 지난 2월부터는 AI 생태계 확장과 기술 접근성 강화를 위해 카나나 모델을 오픈소스로 공개하고 있다. 언어모델 연구 성과를 담은 테크니컬 리포트를 아카이브에 공개하고, 국내 AI 생태계 활성화를 위해 경량 언어 모델 중 '카나나 나노(Nano) 2.1B' 모델을 오픈소스로 배포했다.

지난 5월에는 성능을 한층 향상시킨 1.5 버전을 한차례 더 오픈소스로 공개했다. 기존 모델에서 업그레이드를 거친 카나나 1.5는 에이전틱 AI 구현을 위한 기능 강화에 중점을 뒀다. 글로벌 모델 대비 뛰어난 한국어 성능을 유지하면서 코딩, 수학, 문제 해결, 함수 호출 등에서 이전 대비 평균 1.5배의 성능 향상을 기록했다.

정신아 카카오 대표가 지난해 10월 22일 경기 용인시 카카오 AI 캠퍼스에서 열린 '이프 카카오(if kakao) AI 2024'에서 카카오의 인공지능(AI) 통합 브랜드 '카나나(Kanana)'에 대해 소개하고 있다.
정신아 카카오 대표가 지난해 10월 22일 경기 용인시 카카오 AI 캠퍼스에서 열린 '이프 카카오(if kakao) AI 2024'에서 카카오의 인공지능(AI) 통합 브랜드 '카나나(Kanana)'에 대해 소개하고 있다.
카나나-v, GPT-4o 벤치마크 성능 비교 〈자료 카카오〉
카나나-v, GPT-4o 벤치마크 성능 비교 〈자료 카카오〉

오픈소스 공개 모델 중 '카나나-1.5-8b-instruct' 모델은 한국어 LLM 성능을 평가하기 위해 설계된 벤치마크 플랫폼 '호랑이 리더보드'에서 8B 사이즈(매개변수 80억개) 이하의 모델 가운데 1위를 기록했다. 모델 구조, 데이터셋, 학습 프로세스 등을 모두 처음부터 구축하는 '프롬 스크래치(From scratch)' 방식으로 설계·개발된 국산 모델로 거둔 성과다.

카카오는 지난 7월 국내 공개 모델 중 최고 성능 경량 멀티모달 언어모델과 전문가 혼합(MoE) 모델을 국내 최초 오픈소스로 공개했다. 이미지, 텍스트를 입력 시 자연어로 응답하는 경량 멀티모달 언어모델 '카나나-1.5-v-3b'는 경량 모델임에도 이미지로 표현된 한국어와 영어 문서 이해 능력이 글로벌 멀티모달 언어모델 GPT-4o와 견줄 수 있을 정도로 뛰어나다.

카카오는 자체 기술 기반의 모델을 고도화하면서, 모델 스케일업으로 글로벌 플래그십 수준 초거대 모델 개발에도 도전한다.


김병학 카카오 카나나 성과리더는 “자체 AI 모델 연구·개발을 지속하며 생태계에 새 기준을 제시하고, 자유로운 활용 기반을 만들어가고 있다”면서 “에이전틱 AI 시대에 맞는 모델 고도화를 이어가고, 국내 AI 생태계 자립성과 기술 경쟁력 강화를 위해 노력하겠다”고 말했다.

〈자료 카카오〉
〈자료 카카오〉

변상근 기자 sgbyun@etnews.com