[AI 인사이트 포럼]배경훈 AI 연구원장 “초거대AI 활용, 데이터 전문성과 신뢰성이 좌우”

발행일 : 2023-09-07 16:00 지면 : 2023-09-08 6면

초거대AI추진협의회가 주최하고 한국소프트웨어산업협회와 전자신문이 공동주관하는 '제1회 AI 인사이트 포럼'이 '심화하는 초거대AI 글로벌 경쟁, 신뢰성 있는 AI의 경쟁력'을 주제로 7일 서울 강남구 삼정호텔에서 열렸다. 배경훈 LG AI연구원장이 '초거대 AI 시대, 신뢰할 수 있는 AI의 경쟁력'을 주제로 발표하고 있다. 김민수기자 mskim@etnews.com

“기업이나 정부가 초거대 인공지능(AI)을 제대로 적용·활용하기 위해선 양질의 데이터 확보가 중요합니다. 데이터 전문성, 신뢰성이 확보돼야 산업현장에 유용한 초거대 AI 도입이 가능합니다.”

배경훈 LG AI연구원장은 7일 서울 강남구 삼정호텔에서 열린 '제1회 AI 인사이트 포럼' 기조강연에서 이 같이 강조했다.

배 원장은 “현장에서 AI 적용 수요는 많지만 실제 AI 학습 등을 통해 사용할 수 있는 데이터는 상당히 부족하다”면서 “생성형AI, 초거대 AI를 도입하기 전 기업 내부 데이터 상황을 점검해 현업에 활용 가능하면서 신뢰성 있는 데이터를 얼마나 갖췄는지 우선 살펴야한다”고 조언했다.

이어 그는 “한국 초거대AI 산업 성공여부는 좋은 거대언어모델(LLM)을 만드는 것에 달려있지 않다”면서 “실질적 비즈니스 모델에 AI를 적용해 서비스를 만들고 수익화까지 이뤄내는 것”이라고 말했다.

◇챗GPT가 촉발한 LLM 대전…생성형AI 급속도로 확산

지난해 말 GPT-3.5 버전 등장 후 생성형AI 생태계가 빠른 속도로 확산한다.

배 원장은 “챗GPT 등장으로 생성형 AI 시장 선점을 위한 경쟁이 본격화된다”면서 “오픈AI, 구글 등 빅테크를 중심으로 AI 모델 크기를 지속 확대하는 대규모 범용 모델과 메타와 학계, 스타트업을 중심으로 맞춤형 경량화 모델(sLLM) 간 생태계 주도권 경쟁이 치열해 질 것”이라고 내다봤다.

오픈AI는 지난 3월 GPT-4를 공개한 후 플러그인 서비스 유료화와 기업용(B2B) GPT를 공개하면서 기업시장까지 생태계를 넓힌다. 구글 역시 3월 바드를 공개한 후 지난달 기업용 서비스를 발표하는 등 비슷한 행보를 보인다. 메타는 2월 LLM 모딜 '라마'를 선보인 후 오픈소스로 공개하면서 진영을 확대한다.

배 원장은 “마이크로소프트, 아마존은 자체 LLM 개발 외에 클라우드를 통해 다양한 LLM 서비스를 제공하는 전략을 채택했다”면서 “애플, 테슬라도 LLM 개발에 가세하는 등 미국 나스닥 시총 1￣7위 테크기업 모두 LLMM 개발에 참여 중”이라고 설명했다.

배 원장은 “챗 GPT 방문자수 최근 감소했다는 소식이 들리지만 이는 챗GPT 관심 저조보다는 이와 유사한 서비스가 다수 등장하면서 시선이 분산된 영향이 클 것”이라면서 “다양한 LLM이 등장함에 따라 기업도 서비스 운영 비용 대비 효과 등에 대해 고민해야 하는 시점”이라고 덧붙였다.

◇양질 데이터 확보는 필수…신뢰성 확보도 고민해야

배 원장은 산업 분야별 특화된 맞춤형 LLM으로 혁신을 만들어야함을 강조했다.

그는 “다양한 업종, 분야별로 각각 필요한 생성형AI를 선택·활용하고 이를 실질 서비스에 접목해 수익을 창출하는 구조를 만들어야한다”면서 “생성형AI를 단순히 업무 생산성 향상을 위한 도구로 여기지 말고 산업 영역별로 생성AI 접목 체계를 만든다면 시장 경쟁에서 우위를 점할 수 있다”고 말했다.

이를 위해 중요한 것이 데이터다.

배 원장은 “좋은 AI 모델을 만들기 위해 양질의 데이터가 필요하지만 쓸만한 데이터를 보유한 기업은 거의 없다”면서 “데이터 정비뿐만 아니라 개인정보나 저작권 이슈가 없는 데이터를 확보하는 것이 쉽지 않다”고 말했다.

양질의 데이터는 서비스 신뢰와도 연결된다.

배 원장은 “현재 생성형 AI 기술은 초기 단계로 환각현상(그럴듯하게 꾸민 말)이 심각하며 이를 완벽하게 해결한 기업은 아직 없다”면서 “AI 모델별 데이터 학습 출처에 따라 편향성을 가질 수 밖에 없고 출처가 명확하거나 사실에 근거한 답변을 제공하지 않을 경우 서비스 신뢰도는 더 떨어진다”고 지적했다.

LG AI연구원도 이 같은 문제를 해결하기 위해 여러 시행착오를 겪었다. 초거대 모델 '엑사원'을 개발하는 과정에서 기존 데이터셋을 다시 재정비해 양질 데이터로 전환했다. 논문 등 전문문헌과 뉴스 등 사실에 기반한 답변을 생성하고 출처를 명시해 신뢰성을 높였다.

배 원장은 “다양한 LLM과 생성형AI 서비스가 등장하면서 이 기술을 접목한 서비스 이용자 눈높이도 높아진만큼 초기부터 양질 데이터에 기반한 신뢰있는 서비스를 선보여야 한다”면서 “맥락만 고려해 유창하게 답변을 생성하는 수준을 넘어 전문 문서, 최신 지식 등 사실적 근거에 기반한 답변을 생성하는 모델을 만드는데 주력했다”고 전했다.

◇AI, 생성 넘어 예측으로 가야…산업 분야별 혁신 기대

배 원장은 LLM 생성 기능 이후 단기적으로는 사실 기반 진단이 가능해졌지만 중장기적으로 미래 예측을 통한 통찰을 제시하는 방향으로 발전해야함을 강조했다.

그는 “전문성과 신뢰성이 확보됐다고 하더라도 단순 LLM만으로는 서비스 차별점을 확보하기 어려워질 것”이라면서 “AI가 과거부터 강했던 분야가 예측인 만큼 LLM과 예측을 결합해 사회 문제를 해결하는데 활용돼야 산업별 디지털 혁신도 이룰 수 있을 것”이라고 말했다.

실제 LG AI 연구원은 엑사원에 예측모델을 결합해 △가전제품 해외지역 수요 예측 △AI 투자 포트폴리오 △리튬시장 가격 예측 등 현업에서 실질적 필요한 정보와 인사이트를 제공한다.

배 원장은 “가장 중요한 것은 AI를 단기가 아니라 꾸준히 적용해 사례를 만들고 이를 지속 유지·발전시켜나가는 것”이라면서 “생성형AI 기술과 서비스를 통해 산업 분야별 실질적 성공사례를 만든다면 이를 글로벌로 확산하고 생태계를 구축할 수 있을 것”이라고 강조했다.

김지선 기자 river@etnews.com