이파피루스, AI OCR 솔루션 '텍스트센스' 출시…이미지인식부터 데이터 활용까지 자동화

이파피루스, AI OCR 솔루션 '텍스트센스' 출시…이미지인식부터 데이터 활용까지 자동화

전자문서 솔루션 전문기업 이파피루스(대표 김정희)는 이미지 속 텍스트 인식부터 데이터 활용 업무까지 자동화하는 인공지능(AI) 기반 광학문자인식(OCR) 솔루션 '텍스트센스(TextSense)'를 출시한다고 밝혔다.

회사는 포스트 코로나 시대를 맞아 단순반복 업무를 자동화하는 '로보틱 프로세스 자동화(RPA)'와 인공지능(AI)의 융합을 통해 데이터 수집·활용 등 보다 복잡하고 다양한 업무를 효율적으로 수행하는 수단을 제시했다.

'텍스트센스'는 사람이 기록하거나 인쇄된 이미지를 스캔해 문자 데이터로 변환하는 데 그쳤던 기존 OCR 제품과 달리 축적된 데이터를 통해 스스로 학습한다. 딥러닝을 통해 이미지를 데이터로 전환하면 할수록 더 낮은 품질의 이미지도 자체 보정 작업을 거쳐 더 정확하게 텍스트로 인식할 수 있다. 인식한 텍스트는 내용에 따라 자동으로 분류·저장해 다양한 업무에 편리하게 활용할 수 있다.

문서에서 사용자가 원하는 정보만 빠르게 읽어내는 '핵심어 검출' 기능도 '텍스트센스'만의 특징이다. 사용자가 사전에 원하는 핵심단어를 지정해 주면, 문서 이미지 속에서 해당되는 텍스트 형태를 찾아내고 관련 정보를 우선적으로 추출할 수 있다.

예를 들어 사용자가 '사업자등록번호'를 핵심단어로 설정하면 문서 속에서 '사업자번호' '등록번호' 등 유사한 모양의 단어를 인식하고 관련 숫자 등 정보도 함께 찾아 준다. 꼭 필요한 정보만 빠르게 읽어내기 때문에 텍스트 전체를 읽어야 하는 기존 방식에 비해 효율적이다. 문서가 흐릿하거나 핵심어가 부분적으로만 일치한 경우에도 데이터 추출이 가능하다.

김정희 이파피루스 대표는 “비대면 시스템과 RPA는 공공기관과 금융, 병·의원 등 전 분야에 걸친 화두다. AI 기술을 통해 작업 품질 향상은 물론 데이터 활용까지 자유자재로 가능한 '텍스트센스'가 업무 자동화의 중추 역할을 할 수 있을 것”이라고 말했다.

김 대표는 “이파피루스가 축적한 전자문서 노하우를 바탕으로 개인정보 보호, 실시간 번역 서비스 등 다양한 업무에 활용 가능하다”고 덧붙였다.

안수민기자 smahn@etnews.com