비플라이소프트(대표 임경환)가 한국언론진흥재단의 2020년도 뉴스콘텐츠 디지털화 지원 사업을 수주했다고 12일 밝혔다.
뉴스콘텐츠 디지털화 지원 사업은 한국일보, 서울신문, 전자신문, 서울경제, 헤럴드경제, 국민일보, 세계일보, 한국경제, 아주경제 등 9개 언론사의 과거 발행 지면 중 아직 디지털화가 되지 않은 총 7만9455면의 기사를 디지털화해 각 기관이 활용할 수 있도록 하는 사업이다.
사업 진행 기간은 오는 12월까지이며, 과거 발행 지면을 고해상도로 스캔한 뒤 기사 별로 지면 이미지를 자른 후 데이터베이스화할 예정이다. 각 기사의 텍스트와 발행정보, 제목, 부제목, 기사 카테고리 분류, 기자명, 기자 이메일 등의 메타데이터를 추출, 정리하는 것이 이번 작업의 핵심이다.
비플라이소프트 관계자는 "당사는 2006년 이후 지금까지 뉴스저작권 공식유통사로 일하면서 매일 국내에서 발행되는 모든 지면 기사를 자동으로 디지털화 해 고객들에게 제공하고 있다"고 말했다. 최근 조선일보 100주년을 맞아 선보인 과거 모든 신문의 디지털화 작업도 비플라이소프트가 진행했다.
수십 년 된 기사의 디지털화는 단순한 지면 기사 이미지 커팅과 OCR(Optical Character Recognition, 광학식 문자 판독) 기술만으로 이뤄지는 것이 아닌, 해당 문서가 발행된 때 문화와 사회에 대한 인문한적 이해 등이 필요하다. 또한 당시의 언어 사용 환경, 한자 독해 능력이 필요한 까다로운 작업이다.
이와 관련 임경환 대표는 "이번 사업 수주는 지난 시간 비플라이소프트가 이를 위해 기울인 노력과 쌓은 기술이 인정받은 것이라고 생각한다"며 "올해로 3번째 관련 사업을 수주한 만큼 최고의 품질과 결과를 보여드리겠다"고 말했다.
전자신문인터넷 서희원 기자 (shw@etnews.com)