[정보공원 산책] 정보를 버리자

"UN 총회에서 한국이란 단어가 몇 번이나 나왔을까?" 이것은 10여년 전어느 대통령이 비서관에게 내린 숙제이다. 그 비서관은 그 숙제를 어떻게 했을까 어떻게든 알아내어 보고를 했을 것이다. 쉽게 그 숙제를 했다면 UN 에서 나오는 모든 문서는 디지털화가 되어 있고, 찾기 쉽게 색인이 되어 있다는 점에 착안했을 것이다. 색인이라 함은 어느 단어가 어느 문서에 있는가를 미리 찾아내어 정리를 해둔 것을 말한다. 만약 모든 문서가 그렇게 정리 되어 있지 않았다면 그 비서관은 아직도 UN본부에서 한국이란 단어를 찾고있을 것이다.

얼마전에 신문사, 방송국 그리고 출판사 등을 방문한 적이 있다. 가장 정보를 많이 가진 기관에서는 정보를 어떻게 관리하고 있는가 궁금해서였다.

한마디로모두들 넘쳐나는 정보를 어떻게 할 방법을 찾지 못하고 있었다. 그런곳은 그래도 사정이 나은 편이었다. 대부분의 기관들은 PC로 입력된 정보들도 제대로 체계를 갖춰 관리하지 못하고 있었다. 그리고 그 이전의 정보 들은 텍스트는 스크랩으로, 그림은 슬라이드로 그리고 동영상은 테이프로 보관되어 있었다. 자체적으로 만든 검색 방법들을 사용하고 있긴 하지만 사진 한장 찾는데 기자 한 사람이 사흘을 허비한 적도 있다고 하였다. 뿐만 아니라그렇게 보관된 자료들이 차지하고 있는 공간도 서울의 가장 땅값 비싼 빌딩의 큰 부분을 차지하고 있었다. 그래서 담당자에게 "왜 이것들을 디지털화 하지 않고 이렇게 두느냐"고 물었더니, "누가 디지털화하면 좋은 줄을 모르느냐 그러기에는 너무 많은 돈이 든다"는 대답이었다.

정보가 구축되는 과정을 살펴보면, 정보는 보통 컴퓨터와 전혀 관계없는사람들에 의해 만들어진다. 그런 다음 그 정보들은 압축되어 디지털화된다.

이렇게디지털화된 정보들은 사람들이 잘 찾아볼 수 있도록 색인되어야 한다. 정보가 구축되는 과정에서 돈과 시간이 가장 많이 들어가는 분야는 정보를 만드는 분야이다. 그 다음에는 그 정보를 디지털화하는 과정에 많이 들어간다. 특히 텍스트의 경우 문자인식이 제대로 되지않아 일일이 타이핑해야 하기 때문이다. 색인하는 과정은 위의 두 단계에 비해 돈과 시간이 적게 든다고 할 수 있다. 한 예로 작가에게 소설을 한 편 쓰게 한다거나 동해에 해뜨 는 장면 하나를 만드는데 많은 돈이 들 것이다. 그러나 그것들을 타이핑하거나 압축하여 디지털화할 때는 그 만큼 많은 돈이 들지는 않는다. 그렇게 디 지털화된 정보를 색인하는데는 앞의 두 단계에 비하면 아주 적은 돈이 든다.

그이유 중 하나는 색인하는 과정은 컴퓨터에 의한 자동화가 어느정도 가능하기 때문이다. 바꿔말하면 앞의 두 단계의 일에서는 컴퓨터가 아직 큰 역할 을 하지 못하고 있다고 볼 수 있다.

이렇듯 정보를 구축하는데 드는 돈이 워낙 크기 때문에 아예 정보를 만들때컴퓨터에서 처리할 수 있도록 만드는 것이 좋겠다. 사진을 찍을 때도 아예 디지탈 카메라로 찍거나, 책을 만들 때도 종이 책뿐만 아니라 CD-ROM도 같이 만들면 좋겠다.

사실 정보를 구축하는 문제보다 더 큰 문제는 정보를 버리는 문제이다. 지금자신이 보관하고 있는 정보들을 보면 일년넘어 한번도 들여다 보지 않은정보들이 수두룩할 것이다. 그런 것은 과감히 버려야 한다. 왜냐하면 과거의자료를 찾아보는 일보다 앞으로 봐야할 정보가 훨씬 많기 때문이다. 한번은사무실을 이사할 때가 있었다. 필요한 정보와 필요없는 정보를 고르기도 귀찮아 그냥 박스에 넣어서 이사를 하였다. 1년이 지나서 보니 그때까지 박스 를 풀지 않은 것이 반이 넘었다. 물론 그 박스들은 그대로 쓰레기 통으로 들어갔다. 이렇듯 쓸데없는 정보를 많이 가지고 있으면 그 검색 비용이 엄청나게 들 것은 말할 필요도 없다. 내가 알고있는 어떤 사람은 누가 기념으로 박사학위 논문을 주면 곧장 쓰레기통에 넣는다. 매정하게 보일지 모르지만 어떻게 보면 그 결단력은 본받을 만하기도 하다.