웨어비즈, VLM OCR 'ARGOS Document OCR' 출시

이기종 문서 통합 인식·추가학습으로 자동화 및 유연성 극대화

문서를 읽는데 그치지 않고 문서를 이해하는 광학문자인식(OCR) 솔루션이 등장했다.

웨어비즈(대표 박상길)가 기존 OCR 기술의 한계를 뛰어넘는 차세대 문서 인식 솔루션 'ARGOS Document OCR'을 공식 출시했다고 27일 밝혔다.

이번 솔루션은 비전언어모델(VLM)을 핵심 엔진으로 탑재해 단순 텍스트 추출을 넘어선다. 형태가 서로 다른 이기종 문서의 시각적 배치와 의미적 맥락을 동시에 파악하며, 소량의 학습 데이터만으로도 신규 문서 양식을 신속하게 마스터하는 것이 핵심 강점이다.

기존 OCR은 문서 유형마다 레이아웃을 분석하는 탐지 모델과 글자를 읽는 인식 모델을 따로 개발해 연결하는 '조립식 파이프라인' 구조로 복잡한 표나 양식이 섞인 문서나 학습하지 않은 새로운 서식을 인식할 수 없없다. 반면 ARGOS Document OCR은 문서 종류와 상관없이 이미지 전체를 AI가 한 번에 읽고 이해하는 엔드투엔드 방식으로 별도의 라벨링 작업없이 문서 전체를 엔드투엔트 방식으로 정확하게 인식할 수 있도록 했다.

웨어비즈, VLM OCR 'ARGOS Document OCR' 출시

웨어비즈 관계자는 “ARGOS Document OCR은 단순히 문자를 읽는 데 그치지 않고 문서를 '이해'하는 솔루션”이라며 “디지털 전환(DX) 수요가 높은 정부·공공기관과 금융, 의료 분야를 중심으로 본격적인 시장 공략에 나설 계획”이라고 밝혔다.

이경민 기자 kmlee@etnews.com