
국내 인공지능(AI) 기업 투디지트(대표 박석준)은 한국어 거대언어모델(LLM) 평가 모델 '케이 저지(K-Judge)'를 공개했다고 16일 밝혔다.
K-Judge는 LLM이 생성한 한국어 답변을 문맥과 문법 측면에서 분석해 모델의 완성도와 자연어 처리 능력을 정밀하게 평가할 수 있도록 만든 자체 시스템이다.
특히 인터넷 연결 없이도 작동 가능한 오프라인 환경을 지원하며 외부 서비스 의존 없이 내부 검증이 필요한 보안 중심 산업군에서도 활용 가능성이 높다는 평가를 받고 있다. 실제로 현재 투디지트가 진행 중인 한국수력원자력의 AI 지원 시스템 개발 프로젝트에서도 K-Judge의 활용을 검토 중이다.
이 회사는 K-Judge개발 과정에서 인공지능산업융합사업단(AICA)의 지원을 받았다. AICA의 그래픽처리장치(GPU) 자원으로 한국어 데이터셋 강화와 LLM기술 고도화에 시너지를 낼 수 있었다.향후 국내 AI산업 생태계 조성을 목표로 양 기관이 긴밀한 전략적 협력을 지속할 계획이다.
박석준 대표는 “한국 AI 기술이 점점 더 '자립화'를 향해 움직이고 있다”며 “기존에는 해외 기반의 모델 개발과 툴 활용에 의존해왔던 흐름에서 벗어나 이제는 데이터 수집부터 학습, 평가에 이르기까지 독자적인 기술 스택을 확보하려는 시도가 활발하게 나타나고 있다”고 말했다.
이어 “최근 AI 산업은 단순한 모델 성능 경쟁을 넘어, 각국의 언어.문화.산업 환경에 최적화된 '로컬 AI' 구축이 핵심 키워드로 떠오르고 있다”며 “특히 한국어처럼 문맥, 높임말, 구어체 표현 등이 복잡한 언어의 경우, 해외 LLM 기반만으로는 만족스러운 성능을 확보하기 어려워었다”고 덧붙였다.
박 대표는 “한국어에 특화된 자체 LLM 및 관련 생태계 구축이 중요한 화두였다”며 “K-Judge는 다양한 개발 환경에서 실질적인 도움을 줄 수 있는 기술로 국산 AI 기술의 경쟁력 강화와 자립적 생태계 조성을 위해 지속적으로 노력하겠다”고 강조했다.
업계에서는 모델을 만드는 기술 만큼이나 모델을 제대로 검증하는 기술이 중요해지는 시대라고 진단다. 공공, 금융, 의료 등 민감 정보가 오가는 산업 분야에서는 외부 AI 활용이 불가능한 경우가 많아 자체 개발한 모델의 성능을 독립적으로 측정할 수 있는 국산 평가 체계의 필요성은 더욱 커질 것으로 전망하고 있다.
김한식 기자 hskim@etnews.com