KAIST, 세계 최고 성능 'DBMS' 기술 개발

SQL 질의 처리에 최악-최적 조인 알고리즘 적용
상용 DBMS比 5~20배·美 옴니사이比 88배 빨라

우리 연구진이 세계 최고 수준의 데이터베이스(DB) 저장·검색·관리 시스템 기술을 개발했다. 전에 없던 새로운 접근법을 활용, 처리 성능을 극대화 했다.

한국과학기술원(KAIST·총장 신성철)은 김민수 전산학부 교수팀이 세계 최고 수준 데이터베이스관리시스템(DBMS) 기술을 개발했다고 23일 밝혔다.

DBMS는 방대한 정보를 저장하고 목적에 맞게 검색·관리하는 시스템을 통칭한다. DBMS 데이터 처리에는 질의 언어인 '구조화 질의어(SQL)'를 쓰는데, 연구진이 이를 일신했다.

기존의 것과 KAIST가 개발한 DBMS 질의 처리 방식 개념도
기존의 것과 KAIST가 개발한 DBMS 질의 처리 방식 개념도

대부분 DBMS는 SQL 질의를 처리할 때 데이터 테이블을 '왼쪽 깊은 이진 트리(left-deep binary tree)' 형태로 배치해 처리한다. 과거에는 기본 키(primary key·PK)와 외래 키(foreign key·FK)가 결합된 SQL 질의가 주였는데, 점점 DB 구조가 복잡해지면서 외래 키들이 결합한 것이 많아지고 있다. FK-FK 결합 데이터 테이블은 PF-FK 결합보다 복잡하다.

문제는 기존 DBMS는 PK-FK 결합을 가정해 개발됐다는 점이다. FK-FK 결합이 필요한 SQL 질의는 처리가 매우 느리거나, 하지 못하는 경우도 있었다.

연구팀은 'n항 조인 연산자'를 활용, 데이터 테이블을 규모가 작은 여러 개로 묶었다. 이렇게 만든 '작은 이진 트리' 안에서 FK-FK 결합 관계가 발생하지 않도록 했다. '최악-최적 조인 알고리즘'을 써 작은 이진 트리 처리 결과물을 n항 조인 연산자로 결합했다. 최악-최적 조인 알고리즘은 그래프 데이터를 처리할 때 이론적으로 가장 우수하다고 알려진 알고리즘이다.

기술을 개발한 KAIST 연구진. 왼쪽 위부터 시계방향으로 김민수 교수, 남윤민 박사, 한동형 박사과정.
기술을 개발한 KAIST 연구진. 왼쪽 위부터 시계방향으로 김민수 교수, 남윤민 박사, 한동형 박사과정.

연구팀은 이 기술을 적용한 결과 미국 옴니사의 DBMS보다 최대 88배 성능 향상 결과를 얻었다고 설명했다. 산업표준 벤치마크인 TPC-DS 성능 측정 결과, 세계 최고 수준의 기존 상용 DBMS보다 5~20배 더 빨랐다.

김민수 교수는 “이 기술을 대부분 DBMS에 적용할 수 있다”며 “산업 측면에서 파급 효과가 매우 클 것”이라고 말했다.

대전=김영준기자 kyj85@etnews.com