사이냅 문서필터, 인공지능 OCR 연동으로 이미지속 텍스트 추출 강화

글자 작게 글자 크게 인쇄하기
사이냅 문서필터, 인공지능 OCR 연동으로 이미지속 텍스트 추출 강화

인공지능(AI)〃전자문서 전문기업 사이냅소프트(대표 전경헌)는 '사이냅 문서필터'가 AI OCR(광학문자인식)와 연동해 이미지 내 텍스트 추출 기술력을 강화했다고 15일 밝혔다. 두 솔루션의 결합으로 문서에 포함된 이미지 내 텍스트도 추출할 수 있어 사이냅 문서필터만의 차별화된 경쟁력을 갖춘 것으로 회사는 평가했다.

사이냅 문서필터는 문서에서 텍스트를 추출하는 솔루션이다. 400+ 문서 포맷의 종류를 식별하고 50+ 포맷의 문서 파일로부터 텍스트를 추출한다. 다국어 인코딩 지원, 빠른 속도와 안정성으로 검색 엔진, 메일, 보안 솔루션의 첨부파일 텍스트 필터링에 활용되고 있다.

문서필터는 네이버, 카카오 등 대형 포털 사이트에 적용될 정도로 빠르고 안정적인 텍스트 추출에 강점을 지닌 솔루션이다. 하지만 문서 내 이미지에 포함된 텍스트는 추출할 수 없는 아쉬움이 있었다.

회사는 이러한 한계를 보완하기 위해 문서필터에 AI 딥러닝 기술을 활용해 다양한 형태 이미지에 포함된 텍스트를 인식하는 '사이냅 OCR'과 연동했다. 일반 텍스트는 물론 이미지 내 텍스트까지 인식과 추출이 가능해졌다. 문서에 포함된 모든 텍스트를 완벽히 추출할 수 있게 되어 문서필터의 가치를 한 단계 끌어 올렸다.

김시연 사이냅소프트 부사장은 “기존 문서필터에서 이미지 내 텍스트 추출을 필요로 하는 고객사의 요구가 있었다”면서 “사이냅 문서필터와 사이냅 OCR의 연동으로 고객 요구를 충족해 문서필터 선두 자리를 공고히 하겠다”고 말했다.

안수민기자 smahn@etnews.com