[디지털문서 인사이트]디지털플랫폼 시대 전자문서 진화 요건 및 장기 보존 방안

[디지털문서 인사이트]디지털플랫폼 시대 전자문서 진화 요건 및 장기 보존 방안

1990년 중반부터 업무에서 전자문서 활용이 본격화됐다. 초기에는 문서를 표준화된 규격에 맞춰 작성하고 다시 종이로 출력해서 활용하는 것이 일반적 방식이었다.

세계적으로 디지털전환, 환경 보전 등이 주요 이슈가 되는 시대이니만큼 전자문서는 출력 없이 전자적으로 생산·유통·보존되거나 폐기되는 라이프사이클을 지향하고 있다. 이에 따라 전자문서는 출력을 위한 서식보다 데이터적 가치, 장기간 보존 및 재활용 정도가 더 중요한 목표가 됐다.

그러나 기존의 업무 방식 또는 관행 고수, 디지털 소외 계층, 종이문서 중심의 법적 요구사항 등 아직은 전자문서를 출력하거나 종이로 작성된 문서를 전자화할 필요가 있기 때문에 기존 문서의 특징과 가치 또한 필요한 것이 현실이다.

디지털전환 시대의 전자문서 확산을 위해서는 두 가지 문제가 해소돼야 한다. 첫 번째는 데이터적 활용이다. 30여년 생산되고 축적되어 온 전자문서를 데이터로 활용하고 앞으로 생성될 전자문서를 기존의 특징을 유지하면서 정형데이터로 쉽게 활용할 수 있는 방안이 필요하다. 두 번째는 장기간 보존이다. 10여년 전에 생성된 일부 전자문서 파일 형식은 열람할 수 있는 뷰어가 단종돼 포함된 콘텐츠를 열람하지 못하는 경우가 있다.

이러한 이슈를 해소하고 지속 가능한 전자문서 활용에 필요한 조건은 다음과 같이 제시하고자 한다. 첫째 전자문서 작성 포맷은 표준화되거나 개방형 문서 포맷을 사용해야 한다. 표준화되지 않은 규격으로 작성된 문서는 언제라도 기술적·정책적 문제가 발생할 수 있으며, 빅데이터 분석을 위한 데이터 추출 및 활용도 어렵다.

둘째 전자문서 내용에 대한 맥락정보를 포함해야 한다. 기존 전자문서를 단순히 클라우드 오피스로 작성하고 개방형 포맷으로 저장한다고 해서 데이터로서의 가치가 있게 되는 것은 아니다. 문서 내에 포함된 텍스트나 이미지 등 원천 콘텐츠 유형이 전자문서 내에서 어떤 목적과 용도로 사용되었는지 맥락정보와 구조적 정보(제목, 본문, 주제 등)를 포함해야 한다.

셋째 전자문서를 표현하는 포맷 내부에 모든 정보가 있어야 한다. 전자문서 내부에 해당 문서의 무결성 검증 정보, 맥락정보, 스타일 정보, 링크 등을 통한 외부 참조 없이 표현할 수 있어야 한다.

마지막 조건은 이들 세 가지를 모두 포함할 수 있는 문서 포맷의 개선과 확장이다. 표현 계층, 논리적 구조 계층, 메타데이터를 포함하는 계층과 마지막으로 이들 정보가 물리적인 하나의 파일로 묶여서 유통·보존되도록 하는 것이다.

산업계에서는 전자문서의 활용과 보존성이 진화돼 지속 가능한 방식으로 개선된 것을 디지털문서라는 개념으로 정리하고 있다. 이제 특정 파일 포맷을 통해 자사 솔루션이 시장지배력을 행사할 수 있는 시대를 지나 포맷은 개방하고 함께 발전을 도모하는 것이 시대적 요구이다. 전자문서 관련 산업계는 상호 협력해 전자문서 포맷은 공유하면서 사용자 측면의 편의성과 확장성을 무기로 하는 경쟁이 필요하며, 공공분야에서는 이러한 변화를 적극 반영하여 활용하고 다양한 분야에서 디지털문서가 활성화되는 기회가 돼야 한다. 이를 통해 디지털시대에 부합하는 진정한 전자문서의 진화를 기대해 본다.

남동선 ISO TC171-K(문서관리응용) 위원장(서일대 겸임교수), nam.dongsun@gmail.com