[CIO BIZ+/케이스스터디]바티칸도서관, 빅데이터·IoT 활용한 서적 디지털화 시스템 구축

바티칸도서관 고서 디지털화 작업에 사물인터넷(IoT)·빅데이터·가상화 등 첨단 정보기술(IT)이 녹아들고 있다. 유물 스캔을 통한 단순 디지털화를 넘어 세계 사용자가 쉽게 접근할 수 있는 시스템 구축이 한창이다. 인류 문화유산을 보존해 후세에 전달한다는 철학이 담겼다.

루치아노 아멘티 바티칸도서관 최고정보관리책임자(CIO)는 5일(현지시각) 미국 라스베이거스에서 개최된 ‘EMC 월드 2015’에서 바티칸도서관 고서 디지털화 작업 성과와 계획을 발표했다.
루치아노 아멘티 바티칸도서관 최고정보관리책임자(CIO)는 5일(현지시각) 미국 라스베이거스에서 개최된 ‘EMC 월드 2015’에서 바티칸도서관 고서 디지털화 작업 성과와 계획을 발표했다.

루치아노 아멘티 바티칸도서관 최고정보관리책임자(CIO)는 5일(현지시각) 미국 라스베이거스에서 개최된 ‘EMC 월드 2015’에서 바티칸도서관 고서 디지털화 작업 성과와 계획을 발표했다. 아멘티 CIO는 “지난 2010년부터 시범 사업으로 고서 디지털 보존 작업을 추진하고 있다”며 “디지털 자산 보존뿐아니라 많은 사람이 공유할 수 있도록 배포 시스템에 집중하고 있다”고 말했다.

바티칸도서관은 지난 500여년간 확보한 장서 가운데 8만2000여권의 필사본을 디지털화하고 있다. 지금까지 많은 필사본이 세상에 공개됐다. 그러나 20% 정도가 쉽게 파손될 가능성이 있어 공개가 어려웠다. 바티칸 도서관은 3차원(3D) 디지털화가 가능한 포맷으로 누구나 쉽게 접근 가능한 이미지 저장과 배포 시스템 구축을 시작했다.

바티칸도서관 장서 디지털화는 공유가 핵심이다. 누가복음 필사본 등 가톨릭 유물을 전문적인 학자뿐 아니라 학생을 포함한 모든 사람이 함께 볼 수 있는 체계를 마련했다. 이미지 포맷은 FITS를 선택했다. 오픈소스 기반으로 6개월 단위로 관련 소프트웨어(SW)가 업그레이드돼 지속적 활용이 가능하다는 이유에서다. TIFF처럼 특정 벤더에 종속되는 우려도 덜었다.

IoT·빅데이터·가상화 등 최신 정보기술(IT) 인프라도 도입했다. 비디오 카메라와 전자태그(RFID) 등으로 현재 장서가 위치한 곳을 쉽게 파악한다. 많은 사람이 쉽고 효율적으로 활용할 수 있도록 소프트웨어정의 스토리지 개념이 적용됐다. 데이터센터 구축에 필요한 솔루션은 EMC가 지원했다.

바티칸 도서관은 EMC 스토리지와 가상화 솔루션으로 데이터 정책을 자동화하는 서비스 포털을 만들었다. 8만2000여권의 필사본 한장 한장을 디지털화하는 데 총 45페타바이트(약 4700만기가바이트)가 필요했다. 하둡 기반 빅데이터 분산 시스템이 대용량 데이터 저장과 유통에 적합했다. 아멘티 CIO는 “최근 두 곳의 데이터센터를 구축하고 앞으로 한 곳을 추가할 계획”이라며 “언제든지 디지털화할 수 있는 체계로 빅데이터 이슈에 대응할 것”이라고 덧붙였다.

권동준기자 djkwon@etnews.com