[기고]4차 산업혁명 시대, 도서관 DB화가 절박하다

글자 작게 글자 크게 인쇄하기
[기고]4차 산업혁명 시대, 도서관 DB화가 절박하다

4차 산업혁명이 궁극적으로 지향하는 초연결사회 도래는 도서관계에도 본질적 변화를 요구하고 있다. 종이와 책을 중심으로 한 전통 도서관 서비스는 급속도로 그 형식과 내용에서 디지털 서비스화하고 있다. 조만간 도서관보다 더 많은 정보, 더 양질의 정보를 다른 매체, 예컨대 구글 같은 곳을 통해 더 편리하게 이용하게 되는 시기가 도래할 것이다. 그것을 도서관 특이점(singularity)이라고 할 수 있을지도 모른다. 인공지능(AI)이 인간 지능을 초월하는 순간을 특이점이라고 부르는데, 전통 도서관 기능을 다른 매체가 앞지르는 시기를 의미한다.

국회도서관을 비롯해 많은 도서관이 '미래도서관'을 고민하고 있는 것도 같은 이유다. 인류 지식정보 보존기관으로서 도서관은 정보 보존과 전달수단 혁명적 발전기에 무엇을 지향하고 어떤 서비스를 제공할 것인지, 곧 도서관 존재 이유에 대해 고민을 하지 않을 수 없다.

결론적으로 미래 도서관은 데이터 중심 도서관이 돼야 한다. 초연결사회에서 도서관이 제공하는 대부분 정보는 디지털 데이터 형태로 서비스 될 수밖에 없다. 책을 비롯한 종이류 정보는 그 데이터를 생성하는 기초자원으로써 가치를 갖는다. 데이터 중심 도서관 경향은 앞으로 갈수록 빨라질 것이고, 그만큼 디지털 데이터화 필요성도 증가될 수밖에 없다. 어느 시점 즉 '도서관의 특이점'이 도달하는 때에는 '데이터화되지 않은 도서관 자료는 죽은 정보'라는 말도 성립할 것이다.

지금 우리나라 주요 도서관의 최대 과제도 도서관 자료 데이터화다. 데이터화가 전제되지 않고서는 빅데이터 분석이니, 클라우드 서비스니, AI 개발이니 하는 것도 사실 공염불이다. 국회도서관은 20여년 전부터 원문DB 구축작업을 꾸준히 해왔고, 이미 학술 분야를 중심으로 2억4000만면이 넘는 방대한 원문DB를 구축했다. 이 원문DB는 다른 디지털 서지정보와 함께 우리나라 대부분 도서관에서 활용되고 있다. 하지만 이것도 최고 품질 디지털 서비스를 할 수 있는 수준에 이르기에는 턱없이 부족한 실정이다.

우리나라 미래를 건 4차 산업혁명도 데이터가 뒷받침되지 않으면 사상누각에 그칠 수 있다. 4차 산업혁명이란 비약적 정보통신기술 발전을 매개로 한 지식정보데이터와 AI 기술 결합이라고 할 수 있다. 그렇기에 양질 데이터는 4차 산업혁명 본질적 기반이며, 그 데이터 원천 제공처는 도서관이 될 수밖에 없다. 도서관은 인터넷상에 떠도는 검증되지 않은 정보와는 차원이 다른 신뢰성을 갖춘 고급 정보 보고라는 점에서 그렇다.

작년부터 한국전자통신연구원(ETRI)이 '엑소 브레인' AI를 개발하면서 법률 분야 학습소스로 국회도서관 데이터를 이용하는 것도 그런 정보 품질, 신뢰성 때문이다. 미국이나 일본, 영국 같은 데서 어마어마한 예산을 도서관 자료 데이터화에 쏟아 붓고 있는 것도 같은 이유다.

국회도서관 같은 국가도서관 자료 데이터화는 개별 도서관 차원 노력을 넘어서 국가 과제로 설정돼야 한다. 국가도서관 자료를 데이터화해 이를 우리나라 모든 도서관, 연구기관, 대학, 일반 국민 모두가 쓰는 국가적 지식정보 자산으로 만들어야 한다.

이런 점에서 우리나라가 4차 산업혁명에 성공적으로 대응하려면 IT와 AI 같은 기술에만 집착할 것이 아니라 정부부터 기술 활용 기반이자 원유(原油)격인 데이터 구축에 관심을 기울여야 한다. 구글이 추진하는 도서관 자료 획기적 데이터화를 우리 스스로 대체하려면, 국회도서관은 1000억원 예산을 투입해야 우선 필요한 것을 할 수 있다고 추산한다. 청년 일자리 창출에 몇 조원씩 예산을 투입할 정도라면 국가 미래생존이 걸린 4차 산업혁명 성공을 위해서도 국가 지식정보 데이터화에 천억원 단위 국가 예산을 투입하지 못할 이유가 없다.

최고 품질 도서관 자료를 서둘러 데이터화하고 이를 국가 자산으로 활용하는 정책 결단과 인식이 절실한 시점이다.

허용범 국회도서관장 yb22032@gmail.com