파파고, “텍스트 따로 추출 안 해도 웹, 문서 번역”

파파고, “텍스트 따로 추출 안 해도 웹, 문서 번역”

네이버클라우드가 '파파고 번역' 서비스를 확장한다. 텍스트를 따로 추출하지 않아도 문서 또는 웹페이지 형식 그대로 번역할 수 있다.

기존에 문서나 웹페이지를 번역하려면 텍스트를 직접 추려 번역하고 번역된 문장을 사이트나 서식에 적용해야했다. 신규 출시된 기능을 활용하면 변환 작업 없이 훨씬 간편하게 번역을 사용할 수 있다.

'문서 번역 API' 기능은 폰트 크기 및 색상, 정렬 등 서식이나 표는 그대로 유지한 채 번역한 결과를 출력해준다.

파파고 문서 번역 API는 마이크로소프트 오피스 형식(docx, pptx, xlsx)를 비롯해 국내에서 활용도가 높은 아래한글(HPW 5.0 버전 이상) 문서 번역을 지원한다. 최대 10MB까지 파일을 업로드할 수 있어 사용성을 높였다.

'웹 번역 API' 기능은 웹페이지 내 소스 언어로 작성된 HTML 문서를 파파고 태그 복원 기술을 반영해 원하는 언어로 번역해준다. HTML 소스 내에 태그와 문장을 분리한 후 발췌된 문장 내용만 번역하고, 완성된 번역결과를 다시 HTML 태그와 조합해 완성된 형태 HTML로 보여준다.

API방식으로 제공돼 해당 기능을 사용하고자 하는 기업은 시간과 비용을 절약하면서 업무에 필요한 기능을 바로 적용할 수 있다. 지원 언어는 기존 텍스트 번역에서 높은 품질이 검증된 한국어, 영어, 일본어, 중국어 간체자이다.

네이버클라우드는 추가적으로 현재 개인용 파파고 서비스에서 제공하고 있는 이미지 번역 기능도 기업을 위한 클라우드 서비스로 준비하고 있다. 기존 고객들이 이미지 번역이 필요할 경우 광학 문자 인식(OCR) API와 번역 API를 결합해 활용해야 했다. 이 경우 단순히 문자를 검출해 번역하는 방식으로 문장 구조가 다소 불완전해 사용자가 선택하는 텍스트 영역에 따라 번역 품질이 일정하지 않았다.

파파고 이미지 번역은 인식된 문자 디자인과 문장 구조를 분석해 번역에 적합한 문장을 찾는 자체 딥러닝 모델을 연구 개발해 이미지 번역 품질을 한 단계 높였다.

김시소기자 siso@etnews.com