서울대병원, 의료 데이터 연구에 '글로벌 가명 ID' 도입

서울대학교병원 전경 (사진=서울대병원)
서울대학교병원 전경 (사진=서울대병원)

서울대학교병원이 원내에서 이뤄지는 모든 의료 데이터 연구에 개인식별자를 대체할 '글로벌 가명 ID' 개념을 도입한다. 지난해 개인정보보호법 개정 후속조치로 나온 보건의료 데이터 활용 가이드라인에 따른 것으로 안전한 가명정보 기반 연구를 활성화하기 위한 조치다.

6일 의료계에 따르면 서울대병원은 최근 글로벌 가명 ID 도입을 골자로 하는 '개인정보보호·가명화 시스템' 구축 관련 정책을 확정하고 연말까지 시스템을 구축하기로 했다.

시스템은 연구용 데이터에 동일한 애플리케이션 프로그램 인터페이스(API)로 개인식별자를 모두 제거하는 가명화 과정을 거쳐 글로벌 가명 ID를 부여한다. 의료영상저장전송시스템(PACS), 임상데이터웨어하우스(CDW), 생체신호 데이터베이스(DB), 유전체 정보 등에 보관된 모든 연구용 데이터가 대상이다.

같은 환자의 데이터라도 가명화시 서로 다른 가명 ID를 쓰거나 식별번호를 쓰면 가명정보 간 결합이 쉽지 않다. 동일한 가명화 암호 알고리즘을 적용해 가명 ID를 부여하면 동일한 ID를 가진 가명정보 간 결합이 용이해진다. 예를 들어 CDW에서 추출한 임상 데이터와 PACS에 저장된 컴퓨터단층촬영(CT) 데이터, 다양한 생체 신호 데이터 등 서로 다른 데이터를 글로벌 가명 ID를 기반으로 매칭하면 연구용 데이터셋을 만들 수 있다.

더 나아가 외부 연구자에게 데이터를 제공할 때는 '연구용 익명 ID'로 치환해 제공한다. 글로벌 가명 ID와 연구용 익명 ID간 매칭 테이블은 암호화한 후 원내 데이터사이언스연구부에서 관리하고 필요할 때만 매칭할 수 있도록 해 재식별 위험을 방지한다. 외부 공개용 데이터의 경우 매칭 테이블이 없는 완전 익명화 상태로 공개한다.

시스템 내에 기술 라이브러리로 다양한 가명화·익명화 솔루션을 제공하고 신규 기술을 지속 업데이트해 추가 가명화가 필요한 경우 연구자가 원하는 기술을 적용해 데이터를 가명·익명화 할 수 있다.

정창욱 서울대병원 의생명연구원 데이터사이언스연구부장(비뇨의학과 교수)은 “개인정보보호법 개정으로 가명화를 거친 개인정보를 연구에 활용할 수 있는 장점도 있지만 이에 대한 개인 연구자의 책임 범위도 명확해진 측면이 있다”고 말했다. 정 교수는 “개인정보보호·가명화 시스템을 통해 병원 차원에서 가명정보 활용 연구를 체계적으로 지원할 수 있다”고 설명했다.

서울대병원은 지난해 11월 클라우드 기반 빅데이터 연구 플랫폼 '슈퍼브(SUPERB)'를 구축했다. 내부 연구자들이 고가의 데이터 리소스를 자체 구축할 필요 없이 보안이 강화된 가상 컴퓨터 환경에서 빅데이터 연구를 할 수 있다. 모든 로그와 다운로드 권한이 관리되기 때문에 보안이 강화되고 외부 기관과 공동연구도 수월해졌다. 현재 편의성 개선과 기능 추가 등 고도화 작업을 하고 있다.

정현정기자 iam@etnews.com