라이너 '검색 LLM', 오픈AI GPT-4.1 성능 넘어섰다

라이너 AI 검색 모바일 앱 화면. 라이너 제공
라이너 AI 검색 모바일 앱 화면. 라이너 제공

인공지능(AI) 검색 스타트업 라이너의 자체 평가결과 '라이너 검색 거대언어모델(LLM)'이 AI 검색 답변 생성에 사용되는 핵심 컴포넌트 분야에서 오픈AI 'GPT-4.1' 모델보다 우수한 결과를 기록했다.

라이너 검색 LLM은 사용자 질문을 분석하고 처리하는데 필요한 8가지 핵심 컴포넌트를 통합해 자체 개발한 모델이다. 각 컴포넌트는 오픈소스 모델을 기반으로 10여년 축적한 라이너의 사용자 데이터를 사후 학습해 정밀 설계됐다.

라이너는 동일한 태스크 기준 체계적 내부 검증 프로세스로 오픈AI의 GPT-4.1과 성능(정확도), 처리 속도, 비용(토큰당 가격)을 비교 분석했다. 실제 서비스 환경에서 결과의 재현성과 신뢰성을 확보, 객관적 평가에 주력했다

그 결과 카테고리 분류, 과제 분류, 외부 도구 실행, 중간 답변 생성 등 4개 핵심 컴포넌트 성능·속도·비용 모든 측면에서 GPT-4.1을 능가하는 결과가 나왔다. 질문 분해 여부 판단, 필요 문서 식별, 출처 포함 중간 답변 생성, 할 일 관리 등 4개 컴포넌트에서도 두 가지 이상 항목에서 경쟁우위를 기록했다.

라이너의 자사 '라이너 검색 LLM'과 오픈AI 'GPT-4.1' 비교 평가 결과. 라이너 제공
라이너의 자사 '라이너 검색 LLM'과 오픈AI 'GPT-4.1' 비교 평가 결과. 라이너 제공

라이너가 데이터 학습과 연구개발에 집중한 결과다. 토큰당 처리 비용도 GPT-4.1 대비 평균 30~50% 낮아 대규모 트래픽 환경에서 상대적으로 높은 운영 효율성과 수익성을 확보했다.

조현석 라이너 테크 리드는 “어떤 데이터를 어떻게 학습하고 어떤 구조로 질문을 처리하느냐가 AI 할루시네이션을 줄이는 핵심”이라며 “리서치에 최적화된 정확한 검색 경험을 제공하고 글로벌 시장을 적극 공략해 나가겠다”고 말했다.

박종진 기자 truth@etnews.com