
인공지능(AI) 기술 전문기업 프렌들리AI가 AI 비전문가도 참여할 수 있는 K-언어모델 비교 실험 플랫폼 'WBA(World Best AI·와바)'를 6일 출시했다.
WBA는 블라인드 테스트 방식으로 사용자가 AI 언어모델을 평가할 수 있는 무료 서비스다. 평가순위인 리더보드도 공개한다. 쉬운 사용법과 공정성, 재미 요소를 모두 갖춘 게 특징이다.
국내외 기업이 다양한 언어모델을 오픈소스로 공개하고 있지만, 개발사가 공개한 일부 벤치마크 점수만으로는 실사용 환경에서 어떤 모델이 더 뛰어난지 비교하기 어렵다.
WBA에는 사용자 중심 평가 시스템이 채택됐다. 사용법도 간단하다. WBA에 사용자가 원하는 질문을 입력하면 무작위로 선택된 2개 언어모델이 즉시 답변을 제공한다. '논리적 응답' 옵션을 체크하면 추론 언어모델 2개가 응답을 생성한다. 사용자는 두 답변 중 더 마음에 드는 답변을 선택하면 된다.
평가 대상 모델 이름은 사용자 투표가 끝나야 공개, 점수 조작이 불가능하다. WBA 리더보드 순위는 투표 점수를 합산한 결과로 결정된다.

국내뿐 아니라 해외 모델까지 한눈에 비교할 수 있다.
독자 AI 파운데이션 모델 사업 주관사 네이버 '하이퍼클로바X', 업스테이지 '솔라', SK텔레콤 '에이닷엑스', LG AI연구원 '엑사원' 등 국내 모델은 물론이고 오픈AI '챗GPT', 앤트로픽 '클로드', 구글 '제미나이' 등 빅테크 모델과 알리바바 '큐원', 딥시크와 같은 중국 모델도 함께 등록돼 있다.
전병곤 프렌들리AI 대표는 “대중이 선택하는 진짜 고성능 AI가 무엇인지 확인해볼 기회”라며 “누구나 WBA로 언어모델을 비교하는 재미와 보람을 얻을 수 있을 것”이라고 말했다.
박종진 기자 truth@etnews.com