MS, 업무용 심층연구 에이전트에 멀티 AI 모델 활용 지원

ⓒMS
ⓒMS

마이크로소프트(MS)가 업무용 심층연구 에이전트 '리서처'에 복수의 인공지능(AI) 모델을 활용해 협업하고 상호 평가하는 기능을 제공한다.

사티아 나델라 MS 최고경영자(CEO)는 30일(현지시간) 링크드인을 통해 “'MS365 코파일럿'에서 사용할 수 있는 새로운 멀티 모델 심층연구 시스템 '크리틱'을 소개한다”며 “여러 모델을 한꺼번에 사용해 최적의 답변과 보고서를 생성할 수 있다”고 밝혔다.

크리틱은 2개의 AI 모델 활용, 하나는 연구와 답변 생성을 담당하고 나머지 하나는 타당성 검증과 표현력 향상이나 구조 강화 등을 평가한다. 예를 들어 앤트로픽 '클로드'가 보고서를 작성하면 오픈AI GPT 모델이 해당 보고서를 평가해 결과값을 향상하는 방식이다.

정보 출처가 신뢰할 만한지, 보고서가 완성도 있게 작성됐는지, 보고서 주장이 근거로 뒷받침되는지 등을 검토하고 개선점을 제시한다.

MS가 심층 연구의 정확성·완전성·객관성을 평가하는 벤치마크 'DRACO'를 통해 크리틱 성능을 평가한 결과, 단일 모델 방식과 견줘 분석의 폭과 깊이, 발표 품질, 사실 정확도, 인용 품질 등 4개 지표 모두 더 높은 점수를 받았다. 의학 부문 54.5%, 일반지식 부문 30%, 기술 부문 28.7% 각각 향상됐다.

MS는 두 모델이 동시에 보고서를 작성하는 '카운슬'도 함께 선보였다. GPT와 클로드가 각각 보고서를 작성하면 제3의 전용 심사 모델이 두 보고서를 평가, 주요 결과를 요약하고 두 모델 간 일치하는 내용과 차이가 있는 내용을 비교할수 있게 제시한 다.

이번 신규 기능은 '프런티어' 사용자 대상 먼저 선보이고 이후 적용 대상을 확대할 예정이다.

박종진 기자 truth@etnews.com