KT, MS와 협력한 한국적 AI 모델 '소타K' 출시

KT 기술혁신부문 연구원들이 SOTA K를 테스트하는 모습
KT 기술혁신부문 연구원들이 SOTA K를 테스트하는 모습

KT가 마이크로소프트와 협업해 개발한 GPT-4o 기반 한국적 AI 모델 'SOTA K(소타 K)'를 정식 출시한다. 글로벌 최고 수준 성능의 GPT-4o에 한국 특색을 반영해 개발한 AI 모델이다.

KT는 우선 자사 B2C 사업에 소타K를 적용해 자체 모델 라인업을 검증하고, 향후 파트너사로 서비스 대상을 확대할 방침이다. 이를 통해 국내 AI 생태계의 안정적 성장과 건전한 발전을 도모한다는 전략이다.

KT는 글로벌 최고 수준 성능의 GPT-4o에 한국어와 한국 사회·문화적 맥락을 정교하게 접목한 협업형 모델 소타K를 출시한다고 29일 밝혔다.

KT 소타K는 기존 대형 언어모델(LLM)이 영어 중심 데이터에 기반해 한국어와 문화적 맥락 반영에 한계가 있었던 점을 보완한 모델이다. 고품질 한국 특화 데이터를 대규모로 확보해 GPT-4o에 최적화했다. 이 과정에서 KT의 데이터 품질 관리, 학습·평가·책임 있는 AI 역량과 마이크로소프트의 글로벌 기술력이 결합됐다.

소타 K는 한국적 AI의 4대 핵심 철학인 '데이터 주권 보호', '한국 문화 이해', '모델 선택권 보장', '안전하고 책임감 있는 AI' 등을 모두 반영했다. 한국어 높임말(경어법)·방언은 물론 법률·금융·역사 등 국내 특정 산업군 내에서 사용하는 전문 용어까지 자연스럽게 이해하고 생성할 수 있어 한국 비즈니스 환경에서의 실용성을 높였다.

KT는 자체 구축한 한국형 AI 지표와 전용 데이터셋을 기반으로 소타 K 성능을 정량·정성 평가한 결과, GPT-4o 대비 한국어 이해·생성·추론·문화 맥락 반영·전문지식 측면에서 우위를 보였다고 밝혔다. 특히 공무원 시험과 귀화 시험 등 고난도 한국 특화 과제에서 GPT-4o를 상회하는 성과를 기록해 실효성을 입증했다고 덧붙였다.

KT는 다양한 기업 현장에서 소타K 실효성을 입증했다고 밝혔다. 메리츠화재는 보험 약관 자동 요약과 상담 스크립트 생성에서, EBS는 초중고 수준별 교과 문항 생성에 활용 가능성을 확인했다. 연세의료원은 한국적 표현으로 환자 이해도를 높인 점을, 한국전력은 간결·정확한 응답을 장점으로 꼽았다. KT에 따르면, 소타K는 AI 응답 신뢰도·법률·권리 준수·사회·경제 영향도 등 책임감 항목에서 우수한 평가를 받았다. 악의적 '탈옥(jailbreak)' 공격에도 강력한 방어 능력을 갖춘 것으로 나타났다.

KT는 소타 K를 물리적으로 대한민국 내 존재하는 클라우드 리전에서 운영하며 자체 개발한 벡터 모델 기반 한국적 검색증강생성(RAG) 기술과 결합해 기업별 맞춤형 지식 기반을 구축할 수 있는 서비스 환경도 제공한다. 고객사는 고유 데이터를 활용해 더욱 정확하고 특화된 AI 서비스를 경험할 수 있다.

윤경아 KT 에이전틱 AI 랩장 상무는 “소타 K는 글로벌 수준의 기술력과 한국적 AI 특화를 동시에 실현한 혁신적 모델로 마이크로소프트와의 협업을 통해 축적한 기술적 노하우는 향후 KT의 다양한 AI 모델 개발에 확산 적용될 것”이라며 “국내 AI 생태계 활성화는 물론 공공과 민간 전반에서 AI를 활용한 혁신을 주도하며 국가 AI 경쟁력 제고에 기여할 것”이라고 말했다.

남궁경 기자 nkk@etnews.com