네이버 클로바 '문자 인식' 모델, 국제경진대회서 싹쓸이

세계 최고 대회 RRC서 1위
1~8위 중 5위 제외 상위 석권
실전적·실용적 모델로 인정
'AI 일상화' 아래 지속 기술 개발

네이버 클로바의 문자 인식(OCR) 모델이 관련 분야 세계 최고 경진대회인 'RRC(Robust Reading Competition)'에서 1위를 비롯해 상위권을 휩쓸며 인공지능(AI) 기술 경쟁력을 입증했다.

RRC는 디지털 이미지와 비디오 상의 텍스트를 감지·인식하는 기술인 '로버스트 리딩(Robust Reading)' 분야에서 가장 권위있는 국제 경진대회다. 올해는 세계 최고 컴퓨터 비전 학회인 ECCV의 주관으로, 모델이 학습 과정에서 보지 못한 텍스트를 얼마나 정확하게 읽어내는지 평가하는 'OOV-ST(Out of Vocabulary Scene Text Understanding)' 과제에 대한 성능 경쟁이 이뤄졌다. OOV-ST 과제는 특정 금액을 나타내는 숫자와 같이, 모델의 일반 학습 데이터에 포함될 가능성은 낮지만 일상 환경에서는 중요한 의미를 갖는 텍스트 인식 능력을 평가하는 목적도 있어 실전적이고 실용적인 태스크로 평가받는다.

네이버 클로바 '문자 인식' 모델, 국제경진대회서 싹쓸이

클로바 OCR 모델들은 검출이나 인식 등 특정 기능에 한정하지 않고 OCR 모델의 전반을 평가하는 'E2E(End-to-End) 텍스트 감지' 부문에서 상위권을 휩쓸었다. 1위부터 8위 가운데 5위를 제외한 모두를 클로바 모델이 석권했다. 5위는 글로벌 콘텐츠 플랫폼 '틱톡' 운영사 '바이트댄스'가 차지했다.

네이버 관계자는 “E2E 과제는 OCR 모델 전반에 대한 평가기 때문에 특정 과제 해결 능력을 넘어 모델의 완성도까지 인정받았다는 데 의미가 있다”고 설명했다.

특히 네이버는 대회를 위한 별도 튜닝 작업도 거치지 않고, 실제 서비스에 적용될 모델을 제출한 것으로 알려졌다. 'AI 일상화'라는 기치 아래 기술 개발이 이뤄지고 있는 네이버의 개발 방향성을 엿볼 수 있다.

네이버에 따르면 RRC에서 우승을 비롯해 상위권을 기록한 모델은 현재 상용 모델보다 2배 이상 빠르며, 내년 3월 서비스 적용을 앞두고 있다. 실제 네이버는 영수증으로 업체 방문을 인증하고 진성 리뷰를 작성할 수 있는 '영수증 리뷰', 책 읽어주는 AI 조명 '클로바 램프(CLOVA Lamp)' 등 OCR 기술 기반 서비스를 제공하고 있다. 네이버클라우드플랫폼을 통해 다양한 파트너들이 클로바 OCR 기술을 솔루션 형태로 활용하기도 한다. 흥국화재가 클로바 OCR 기술을 이용해 보험금 지급에 필요한 월 100만장에 가까운 의료비 영수증 처리를 자동화하고 있다.

네이버 클로바측 관계자는 “OCR 분야 최고 권위 챌린지에서 거둔 우수한 성과로 글로벌 최고 수준의 AI OCR 기술력을 다시 한번 입증할 수 있었다”며 “이를 네이버의 다양한 서비스에 적용하는 한편, 플랫폼 파트너들을 위한 기술 솔루션으로 제공해 'AI 일상화'를 통한 사용자 가치를 높여나가겠다”고 말했다.

성현희기자 sunghh@etnews.com